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PROLOGO A LA CUARTA EDICIÓN 


El cambio más importante respecto a la tercera edición es la nueva 


_ versión del capítulo que trata de la electrodinámica cuántica. La electro- 
dinámica cuántica expuesta en la tercera edición describía el movimiento 


de partículas cargadas individuales, en estrecha analogía con la electro- 
dinámica clásica. Era una forma de la teoría en que se conservaba nece- 
sariamente el número de partículas cargadas, y no podía genéralizarse para 


permitir la variación del número de ellas. 


Actualmente, en física de altas energías se da con frecuencia la creación 
y aniquilación de partículas cargadas. Por consiguiente, una electrodinémica 


cuántica que exija la conservación del número de partículas cargadas está 


lejos de la realidad física. Así pues, la hemos substituido por una electro- ae 
dinámica cuántica que incluye la creación y aniquilación de pares electrón- 
positrón. Ello nos obliga a abandonar toda analogía estrecha con la teoría 


clásica de los electrones, pero nos proporciona una descripción más ajuss- 


tada de la naturaleza, Parece pues que el concepto clásico de electrón deja | 


de ser un modelo válido en física, salvo para Et de | 
que se limiten a considerar fenómenos de baja energía. 
: | P.A. M.D. 


St.. John's College, Cambridge 
| 11 de mayo de 1957 
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DEL PRÓLOGO A LA PRIMERA EDICIÓN E 
Los inétodos de trabajo de la física teórica han sufrido un profundo 
cambio en el presente siglo. La tradición clásica consideraba el mundo como 
la asociación de objetos observables (partículas, fluidos, campos, etc.) que 38 — .' 


- mueven según leyes de fuerza fijas, pudiéndose, pues, formar una imagen: : 
mental de todo el esquema en el espacio y el tiempo. Ello conducía a una . > 
física cuyo método consistía en hacer hipótesis sobre el mecanismo y las 

_ fuerzas que relacionan dichos objetos observables, que explicaran su com-" 

portamiento de la forma más sencilla posible. En los últimos tiempos se ha 


distinto. Sus leyes fundamentales no rigen el mundo directa tal como 
éste aparece en nuestra imagen mental, sino que actúan sobre un substrato . 
del que no podemos formamos ninguna imagen mental sin cometer desa- - 
tinos. La formulación de dichas leyes exige el empleo de las matemáticas 
de transformaciones. Los elementos importantes del mundo físico aparecen... 
como los invariantes de dichas transformaciones (o más en general los 
casi-invariantes, o cantidades que se transforman de modo sencillo). Las 
cosas que conocemos de modo inmediato son las relaciones de estos cast-- 
invariantes con un cierto sistema de referencia, que generalmente elegimos 
de forma que se introduzcan simplificaciones particulares sin importancia 
- desde el punto de vísta de la teoría general. o 
El auge de la teoría de transformaciones, aplicada primero a la rela- 
_ tividad y después a la teoría cuántica, constituye el fundamento de los 
nuevos métodos de la física teórica. Otra característica del desarrollo de 
la teoría es la obtención de ecuaciones que sean invariantes frente a 
transformaciones cada vez más generales, Este modo de proceder es muy 
aatisfactorio. desde el punto de vista filosófico, pues reconoce el po | 
papel del observador, permitiendo englobar las reglas que se deducen 
de sus observaciones particulares en un esquema único, y mostrando quela . 
_naturaleza: no se comporta de modo arbitrario; pero a cambio dificulta . 
4 compre para el estudioso de la física. Las nuevas teorías, ei se conel- 
deran ir e de su estructura matemática, están constituidas .: 
- por conceptos físicos que no pueden expresarse mediante términos o ele- 
mentos conocidos previamente por el estudiante, y que ni siquiera pue- as 
_den explicitarse adecuadamente con palabras. Al igual que los conceptos 
fundamentales (como por ejemplo, proximidad, identidad) que cada uno ha >. 
-- de aprender desde que nace, los nuevos conceptos de la física sólo pueden .-.- 
dominarse familiarizándose con sus propiedades y usos. ic 
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| E Desde el punto de vista matemático, la comprensión de las nuevas 


+ teorías no presenta ninguna dificultad, ya que las matemáticas necesarias 

+ + (por lo menos las que se necesitan para el desarrollo de la física hasta nues- 
+. Hros días) no son esencialmente distintas de las que se empleaban anterior- 
_ mente. Las matemáticas son el instrumento especialmente indicado para 


.. tratar conceptos abstractos de cualquier clase, y en este campo su poder 
- no tiene límites. Por esta razón todo libro sobre la nueva física, que no sea 
- puramente una descripción de trabajos experimentales, ha de ser esencial- ' 
nte matemático. Sin embargo, las matemáticas no son más que un instru- 


mento y deberíamos aprender a apropiarnos de las ideas fisicas sin tefe- 
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rencia a su forma—matemática. En este libro hemos procurado poner en 
primer plano el aspecto físico, comenzando por ún capítulo enteramente 
físico y procurando examinar en lo posible el significado físico que en- 
- clérra el formalismo en los capítulos siguientes. Se necesita gran cantidad 
_' de conocimientos teóricos para poder resolver problemas de valor práctico, 
pero este hecho es una consecuencia inevitable del importante papel que 
- tiene la teoría de transformaciones y que está destinado a acentuarse en 
-  lasfísica teórica del futuro. | 
Respecto al formalismo matemático en que puede presentarse la teoría, 


o ca “el autor ha de decidirse desde el principio entre dos métodos. Uno es el 
2 método simbólico, que considera directamente y de forma abstracta. las 
ost €antidades de importancia fundamental (invariantes, etc., de las transfor- 


_ maciones) y el otro se basa en el empleo de coordenadas o representaciones 
- Y trata con confuntos de números que corresponden a dichas cantidades. 


. Por regla general siempre se. ha utilizado el segundo método para presentar 


la mecánica cuántica (de hecho se ha utilizado prácticamente siempre a ex- 
.. cepción del libro de Wey]l titulado Gruppentheorie und Quantenmechanik). 
. Dicho método se conoce con los nombres de “mecánica ondulatoria y 
“mecánica de las matrices” según a cual de los elementos físicos, estados. o 
variables dinámicas del sistema, se le conceda mayor importancia. Tiene 
_ la ventaja de que las matemáticas que exige son más familiares para el 
-. estudiante medio y además es el método histórico. | — 
| Sin embargo, el método simbólico parece atacar con más profundidad 
_ la naturaleza de las cosas. Nos permite expresar las leyes físicas de una 


ñ > 7 forma clara y concisa, y probablemente se irá utilizando cada vez más 


en el futuro a medida que vaya siendo mejor conocido y se vayan desarro- 


* 0 e llando las matemáticas especiales que emplea. Por esta razón hemos elegido 


el método simbólico, introduciendo sólo después las representaciones como 


-. > ayuda para los cálculos prácticos. Ello ha exigido romper completamente 


con la línea de desarrollo histórica, pero nos permite el-acceso a las nuevas 
“+ ideas de la forma más directa posible. A: 
E P.A. M.D. 
St. John's College, Cambridge 
29 de mayo de 1930 A 
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EL PRINCIPIO DE SUPERPOSICIÓN 


1. Necesidad de una teoría cuántica 


La mecánica clásica se ha ido desarrollando progresivamente desde los | 


tiempos de Newton y se ha aplicado a un conjunto de sistemas dinámicos 
cada vez más amplio, del que forma parte el campo electromagnético en 
interacción con la materia. Las ideas fundamentales y las leyes que rigen 





su aplicación constituyen un esquema tan sencillo y elegante, que parece 


imposible modificarlo seriamente sin destruir todas sus atractivas caracte- 
rísticas. Sin embargo, se ha conseguido construir un nuevo esquema, llamado 
mecánica cuántica, más adecuado para la descripción de los fenómenos de 
escala atómica, y que es en ciertos aspectos más elegante y satisfactorio 


que el esquema clásico. Esto ha sido posible gracias a que los cambios 


introducidos por la nueva teoría son de carácter muy profundo y no simples 
modificaciones que destruirían las características de la teoría clásica que le 
confieren su armonía, y así ha resultado que todas estas características han 
podido ser incorporadas al nuevo esquema. 


La necesidad de elegir un camino distinto al de la mecánica clásica 
viene exigida por los hechos experimentales. En primer lugar, las fuerzas 


conocidas en electrodinámica clásica son inadecuadas para justificar la nota- 
ble estabilidad de átomos y moléculas, necesaria para poder explicar que las 


substancias tengan propiedades físicas y químicas definidas. La introducción 


de nuevas fuerzas hipotéticas no podría salvar la situación, ya que existen 
principios generales de la mecánica clásica, válidos para cualquier tipo de 
fuerzas, que nos conducen a resultados en completo desacuerdo con la 
observación. Por ejemplo, si el estado de equilibrio de un sistema atómico 
está alterado de algún modo y se le abandona a sí mismo en estas condi- 
ciones, debería comenzar a oscilar, y.sus oscilaciones tendrían que ponerse 
de manifiesto en el campo electromagnético que se emite, de modo que sus 
frecuencias habrían de ser observables con un espectroscopio. Cualesquiera 
que fuesen las fuerzas que rigen este equilibrio, debería ser posible incluir 
las diversas frecuencias en un cuadro que comprendiera ciertas frecuencias 
fundamentales y sus armónicos. Esto no corresponde a lo que se observa. 


- 
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En su lugar aparece una nueva e imprevista relación entre las frecuencias, 
. llamada ley de combinación de Ritz de la espectroscopia, según la cual 
- todas las frecuencias pueden ser expresadas como diferencias entre ciertos 


términos, siendo el número de términos muy inferior al de frecuencias. 


- Esta ley es completamente incomprensible desde el punto de vista clásico. 


Se puede intentar salvar la dificultad sin apartarse de la mecánica clásica, . 
suponiendo que cada una de las frecuencias observadas con medidas espec- 
troscópicas es una frecuencia fundamental inherente a su propio grado de 
libertad, siendo las leyes de fuerza tales que no puedan darse los armónicos 
correspondientes. Sin embargo, una teoría como ésta mo sería válida, aparte 
de no dar explicación alguna de la ley de combinación, ya que entraría en 
conflicto inmediato con la evidencia experimental sobre calores específicos. 
La mecánica estadística clásica nos permite establecer una relación general 


entre el número total de grados de libertad de un conjunto de sistemas 


vibrantes y su calor específico. Si se hiciera la hipótesis de que todas las 


> frecuencias espectroscópicas de un átomo corresponden a distintos grados 


de libertad, se obtendría un calor específico para todas las sustancias mucho 
mayor que el observado. De hecho, los calores específicos observados a 
temperaturas ordinarias vienen dados con bastante exactitud por una teoría 
que considere el movimiento de cada átomo como el de un todo sin atribuirle 
ningún movimiento interno. 0 

Esto nos lleva a un nuevo antagonismo entre la mecánica clásica y los 


resultados experimentales. Debe existir necesariamente algún movimiento 
interno en los átomos para poder explicar su espectro; pero sus grados de 


libertad internos, por razones incomprensibles clásicamente, no contribuyen 


al calor específico. Otro conflicto similar se encuentra a propósito de la 


energía de oscilación del campo electromagnético:en el vacío. La mecánica 
clásica da un valor infinito para el calor específico correspondiente a esta 


energía, pero se ha podido comprobar que es perfectamente finito. La con- 


clusión general de los resultados experimentales es que las oscilaciones de 
gran frecuencia no contribuyen en su valor clásico al calor específico. 

Un ejemplo más de la limitación de la mecánica clásica lo constituye el 
comportamiento de la luz, "Tenemos, por un lado, los fenómenos de inter: 
ferencias y de difracción, que sólo pueden ser explicados mediante una 
teoría ondulatoria; por el otro, fenómenos tales como la emisión fotoeléc- 
trica y la dispersión (scattering), de electrones libres, que indican que la luz 


está compuesta por pequeñas partículas, Dichas partículas, llamadas foto- 


nes, tienen cada una una energía y un momento definidos, que dependen 
de la frecuencia de la luz, y aparecen con una existencia tan real como la de 


los electrones o cualesquiera otras partículas conocidas en física. No se 


observa nunca una fracción de fotón. 

Los experimentos han demostrado que este extraño comportamiento no 
es peculiar de la luz, sino que es completamente general. Todas las particu- 
las materiales tienen propiedades ondulatorias, que se ponen de manifiesto 
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en condiciones adecuadas. Éste es un ejemplo muy sorprendente y carac- 
terístico de los fallos de la mecánica clásica, que no radican simplemente 
- en una inexactitud de sus leyes del movimiento, sino en una insuficiencia 
de sus conceptos para proporcionarnos una descripción de los fenómenos 
atómicos. 

La necesidad de apartarse de las ideas clásicas al intentar dar una expli- 
cación de la estructura elemental de la materia se deriva no sólo de los 
hechos establecidos experimentalmente, sino también de razones filosóficas 
generales. En una interpretación clásica de la constitución de la materia, 
se supondría que ésta está compuesta por un gran número de pequeñas 
partes, y se postularían leyes del comportamiento de dichas partes, de las 
cuales se pudieran deducir las leyes de la materia agrupada. Sin embargo, 
no sería una explicación completa, pues habría quedado sin considerar la 
estructura y estabilidad de las partes constituyentes. Para responder a esta 
cuestión se haría necesario postular que cada una de las partes constitu- 
yentes está a su vez compuesta de pequeñas partes, en razón de las cuales 
debe explicarse su comportamiento. Evidentemente no hay límite para este 
proceso, de tal forma que es imposible llegar por este procedimiento a la 
estructura elemental de la materia. Mientras grande y pequeño sean con- 
ceptos meramente relativos, no conduce a nada explicar lo grande en función 
de lo pequeño. Por tanto, es necesario que modifiquemos las ideas clási- 
cas de forma que el tamaño adquiera un carácter absoluto. 

En este punto es importante recordar que a_la. ciencia solamente le 


un objeto si interacciona con alguna influencia externa. Todo acto de obser- 
vación va acompañado necesariamente de una alteración del objeto ob- 
servado. Podemos decir que un objeto es grande cuando la alteración que 
acompaña a nuestra observación de él pueda ser despreciada, y pequeño 
cuando no pueda serlo. Esta definición está plenamente de acuerdo con el 
significado corriente de las expresiones grande y pequeño. 

Normalmente se supone que, procediendo con cuidado, podemos reducir 
la alteración que acompaña a nuestra observación a una amplitud tan 
pequeña como queramos. En este caso, los conceptos grande y pequeño 
son meramente relativos y se refieren tanto a la precisión de nuestros medios 
de observación como al objeto que se describe. Para poder dar un significado 
absoluto a la magnitud, tal como se requiere en toda teoría de la estructura 
elemental de la materia, hemos de que existe un límite de la pre- 
cisión de nuestro poder de Observación y de la magnitud de la alter 
que le acompaña — límite que es inherente a la naturaleza de las cosa, 

que es imposible superar aunque se perfeccionen las técnicas o se aumente 
a habilidad práctica del obsernador. Si el objeto que consideramos es» 
tal que la alteración límite inevitable se puede despreciar, decimos que el 
objeto es grande en sentido absoluto y podremos aplicarle la mecánica 
clásica. Si, en cambio, dicha alteración no es despreciable, el objeto es 
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pequeño en sentido absoluto y será necesaria una nueva teoría para dar 
cuenta de él, | | | 

Como consecuencia, de la discusión precedente debemos revisar nues- 
tras ideas sobre la causalidad. La relación causal se aplica exclusivamente 
a sistemas que no hayan sido alterados. Pero si el sistema es pequeño, nos 
es imposible observarlo sin producir en él una alteración considerable, y 
¡por lo tanto, no podemos esperar encontrar ninguna relación causal entre los 
resultados de nuestras medidas, Supondremos que sigue existiendo censali 
dad para los sistemas mientras no se les altere, y les ecuaciones que esta- 
bleceremos para describir los sistemas no alterados serán ecuaciones dife- 
renciales que expresarán una relación causal entre condiciones en un instante 
y condiciones en otro instante posterior. Estas ecuaciones estarán en estrecha 
correspondencia con las ecuaciones de la mecánica clásica, pero sólo estarán 
indirectamente relacionadas con los resultados de las observaciones. Existe, 
pues, una indeterminación inevitable en el cálculo de los resultados obser- 
vables, y la teoría no nos permite calcular, en general, más que la probabi- 
lidad de obtener un resultado particular al hacer la observación. 


2. Polarización de fotones > 
La discusión de la sección precedente acerca del límite de la precisión 
- con que pueden ser realizadas las observaciones y la indeterminación con- 
siguiente en los resultados de dichas observaciones no nos proporciona 
- ninguna base cuantitativa para la construcción de la mecánica cuántica. 
Para este fin necesitamos un nuevo conjunto adecuado de leyes de la natu- 
raleza. Una de las fundamentales y más eficaces es el principio de superpo- 
sición de los estados. Llegaremos a la formulación general de este principio 
a través de algunos casos particulares, y tomaremos como primer ejemplo 
el que nos proporciona la polarización de la luz. Ñ 
Se sabe experimentalmente que cuando se utiliza luz de polarización 
rectilínea para expulsar fotoelectrones, existe una dirección privilegiada de 
la emisión electrónica. Por tanto, las propiedades de polarización de la luz 
están íntimamente relacionadas con sus propiedades corpusculares y así se 
debe atribuir una polarización a los fotones. Así pues, debemos conside- 
rar que un haz de luz polarizada rectilíneamente en una cierta dirección 
está constituido por fotones, cada uno de los cuales está polarizado rectilínea- 
mente en dicha dirección, y que asimismo un haz de luz polarizada circu- 
larmente está constituido por fotones cada uno de ellos polarizado circular- 
mente. Cada fotón está eu un cierto estado, llamado estado de polarización. 
El problema que hemos de considerar es cómo adaptar estas ideas a los 
fenómenos conocidos de la separación de la luz en componentes polarizadas 
y de la recombinación de estas componentes. | 
Elijamos un caso concreto. Supongamos que tenemos un haz de luz que 
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atraviesa un cristal de turmalina, que tiene la propiedad de dejar pasar 

+ únicamente luz polarizada según un plano perpendicular a su eje óptico. 
-——— Laelectrodinámica clásica explica lo que ocurre para cualquier polarización 

del haz incidente. Si dicho haz está polarizado según un plano perpendicu- 

lar al eje óptico, todo él atravesará el cristal; si lo está según un plano 

paralelo al eje, no lo atravesará en absoluto; mientras que si está polarizado 

según una dirección que forma un ángulo «a con el eje, atravesará una 

fracción sena de él. ¿Cómo podemos interpretar estos resultados sobre la 

, base fotónica? > (fu él lican ? ? 

pe Un haz polarizado rectilíneamente en una cierta dirección debe imagi- 

“ fÍ narse constituido por fotones cada uno de ellos polarizado en esa dirección, 

| 1 Esta imagen no presenta ninguna dificultad en los casos en que el haz 

incidente está polarizado según un plano perpendicular o paralelo al eje 

óptico. No tenemos más que suponer que cada fotón polarizado perpen- 

dicularmente al eje atraviesa el cristal sin obstáculo y sin sufrir cambio 

alguno, mientras que si está polarizado paralelamente al eje es frenado 


y absorbido. La dificultad aparece, en cambio, en el caso de polarización : 
cuan 


oblicna y no es evidente lo que le debe ocurrir a uno de tales fotones 
canza la turmalina. 

La pregunta de qué le ocurre a un determinado fotón bajo unas condi- 
ciones definidas no tiene un significado demasiado preciso. Para precisarlo 
debemos imaginar algún experimento que tenga relación con ella y pre- 
guntarnos cuál será el resultado del mismo. Sólo tienen significado real las 

- preguntas sobre los resultados de experimentos y son éstas las únicas pre- 
- guntas que debe contestar la física teórica. 

En nuestro ejemplo dicho experimento consiste en utilizar un haz inci- 
dente constituido por un único fotón y observar qué es lo que aparece al 
otro lado del cristal. Según la mecánica cuántica el resultado de este expe- 

-rimento es que al otro lado encontraremos unas veces un fotón entero de 
energía igual a la del fotón incidente, y otras no aparecerá nada. Cuando 
aparezca un fotón entero, estará polarizado perpendicularmente al eje 
óptico. En ningún caso tr sólo fotón. 
Si repetimos el experimento un gran número de veces encontraremos que 
aparece un fotón por el otro lado en una proporción sen*a del número total 
de veces. Podemos decir que el fotón tiene una probabilidad sen*a de pasar 
a través de la turmalina y aparecer por el otro lado polarizado según un 
plano perpendicular al eje, y una probabilidad costa de ser absorbido. 
Tales valores de la probabilidad conducen a los resultados clásicos correc- 
tos en el caso de un haz incidente con un gran número de fotones. 

Por este procedimiento conservamos en todos los casos la individualidad 
del fotón. Pero ello sólo es posible si abandonamos el determinismo de la 
teoría clásica. El resultado de un experimento no está determinado por 

-condiciones controlables por el experimentador como ocurriría de acuerdo 
con las ideas clásicas. Lo máximo que podemos predecir es un conjunto 


4 a 
. hi Y poor LN ve SU. ps 2 (A pl 
*» 5 e Es Ñ l EA | / ? id 
a 3 pia 
0 o nena | 














E 
F 


20 EL PRINCIPIO DE SUPERPOSICIÓN 


- de resultados posibles, y la probabilidad de que ocurra cada uno de ellos. 


La discusión precedente sobre el resultado de un experimento con un 
único fotón polarizado oblicuamente que incide sobre un cristal de turma- 
lina contesta a todas las preguntas que se pueden formular legítimamente 
sobre lo que le ocurre a un fotón bajo esas condiciones. Preguntas tales 
como qué es lo que decide si el fotón atraviesa o no el cristal y cómo cambia 
su dirección de polarización cuando lo atraviesa, no pueden ser investigadas 
mediante experimentos y fue inio de la 
ciencia. No obstante, para relacionar los resultados de este experimento 
con los de otros experimentos que se pueden realizar con fotones y englo- 
barlos todos dentro de un esquema general, es necesaria una descripción 
ulterior. No debe considerarse dicha descripción como un intento de res- 
ponder a problemas que están fuera del dominio de la ciencia, sino.como 


una ayuda para la formulación de leyes que expresen de forma concisa 
los resultados de un gran número de experimentos. 


La descripción ulterior que nos"proporciona la mecánica cuántica es la 
siguiente. Se supone que un fotón polarizado según un plano oblicuo al 
eje óptico puede considerarse que está en parte en el estado de polarización 
paralelo al eje y en parte en el estado de polarización perpendicular al eje. 
El estado de polarización oblicua puede ser considerado como el resultado 


_de un cierto proceso de superposición aplicado a los dos estados de pola- 


rización paralela y perpendicular. Ello implica una cierta relación entre los 


-diversos estados de polarización similar a la de la óptica clásica para haces 


polarizados, pero que ahora no se aplica a los haces sino a los estados de pola- 
rización de cada fotón particular. Esta relación nos permite resolver o 
expresar cualquier estado de polarización como una superposición de un 
par arbitrario de estados de polarización perpendiculares entre sí. 

Cuando hacemos chocar un fotón con un cristal de turmalina, le some- 


- temos a una observación. Observamos si está polarizado bien paralela o bien 


perperdicularmente al eje óptico. El efecto de esta observación es obligar ' 
al fotón a que esté enteramente en el estado de polarización paralela o 
enteramente en el estado de polarización perpendicular. Se ve obligado a 
dar un salto brusco de estar parcialmente en cada uno de dichos estados 
a estar enteramente en uno u otro de ellos. No se puede predecir a cuál 
de los dos estados pasará, y únicamente existe una ley que nos da cada 
una de las dos probabilidades. Si salta al estado de polarización paralela 
será absorbido y si salta al de polarización perpendicular atravesará el 


- Cristal y aparecerá por el otro lado conservando dicho estado de polari- 


zación. 


S 
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En esta sección vamos a considerar otro ejemplo de superposición. 
También utilizaremos fotones, pero ahora nos interesaremos por su posición 
en el espacio y por su momento, en lugar de interesarnos por su polariza- 
ción. Si disponemos de un haz de luz estrictamente monocromática, cono- 
cemos algo acerca de la posición y momento de los fotones asociados. 
Sabemos que cada uno de ellos está localizado en algún lugar de la región 
del espacio por donde pasa el haz, y que tiene un momento según la direc- 
ción del haz cuya magnitud viene dada en función de la frecuencia de 
éste por la ley de Einstein del efecto fotoeléctrico — momento igual a fre- 
cuencia multiplicada por una constante universal. Cuando tengamos una 
información como ésta sobre la posición y el momento de un fotón diremos ; 
que está en un estado de traslación definido. | - 
Expliquemos la descripción que da la mecánica cuántica de la interfe> di pe 
rencia de fotones. Elijamos un experimento concreto de interferencia. Supon- y, 
gamos que un haz de luz ha pasado a través de un interferómetro, y que se 
ha dividido en dos componentes que se hacen interferir a continuación. 
Como en la sección precedente, podemos elegir el caso de un haz consti- 
tuido por un único fotón, y preguntarnos qué le ocurrirá cuando atraviese 
el aparato. Así se pondrá claramente de manifiesto el conflicto entre las; y 
teorías ondulatoria y corpuscular de la luz. | lr 
De acuerdo con la descripción que hemos dado en el caso de la polari- | 
zación, tenemos que considerar que el fotón esté parcialmente en cada una 
de las dos componentes en que se ha dividido el haz incidente. Diremos que + 
«Lion se halla en un estado de mastación-tudo pOr la superposición e 
de los dos estados de traslación asociados a las dos componentes. Esto nos 
induce a generalizar el término “estado de traslación” aplicado a fotones. 
Para que un fotón esté en un estado de traslación definido no es necesario 
que esté asociado a un único haz de luz, sino que puede estarlo a dos o más 
haces, que son las componentes en que se ha dividido el haz inicial.* 
En la teoría matemática rigurosa, cada estado de traslación está asociado a 
una de las funciones de onda de la óptica ondulatoria clásica, que puede 
representar un único haz o bien dos o más haces en los que se haya dividido 
el haz inicial. Los estados de traslación se pueden superponer de forma 
análoga a las funciones de onda. 
Veamos qué ocurre cuando determinamos la energía en una de las com- 
ponentes. El resultado de tal determinación ha de ser o bien que encon- 
tremos el fotón o que no encontremos nada, Así pues, el fotón debe cambiar 
bruscamente de estar parcialmente en uno de los haces y parcialmente en el 


* El hecho de que la idea de superposición nos obligue a generalizar el significado 
de los estados de traslación y no, en cambio, el de los estados de pao n de la 
secalón anterior es accidental y no posee ningún significado teórico fundamental. 
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otro a estar totalmente en uno de ellos. Este cambio brusco es debido a 
la alteración del estado de traslación del fotón que necesariamente lleva 
consigo toda observación. Es imposible predecir en cuál de los dos haces 
encontraremos el fotón. Únicamente podemos calcular la probabilidad de 
cada resultado basándonos en la distribución previa de fotones en cada haz. 

Se podría llevar a cabo la medición de energía sin destruir el haz 
componente, por ejemplo, reflejándolo sobre un espejo móvil y observando 
su retroceso. Nuestra descripción de loa fotones permite inferir que, 
después de tal medición de energía, no sería posible llevar a cabo ningún 
efecto de interferencia entre las dos componentes. Mientras el fotón está 

cialmente en cada uno de los haces pueden producirse inte 

al superponerse ambos haces, PES ic » 
mediante una observación, oblig ona En a estar enteramente ep unc 







de los haces. En el último caso el otro haz ya no interviene para nada en la 


descripción del fotón, de manera que debe considerársele integramente en 
el primero de ellos como en el caso ordinario, a efectos de cualquier expo- 
rimento que pueda realizarse a continuación con él, 

De este modo la mecánica cuántica permite reconciliar las teorías ondu- 
latoria y corpuscular de la luz. El punto fundamental es la asociación de 
ación deu até a vas de las funciones de onda de la 
óptica ondulatoria ordinaria. La naturaleza de esta asociación no puede 
imaginarse sobre la base de la mecánica clásica; es algo completamente 
nuevo. Sería totalmente incorrecto imaginar que el fotón y su onda asociada 
están en interacción y suponer que dicha interacción es análoga a las que 
se dan en mecánica clásica entre partículas y ondas. La interpretación de 
dicha asociación sólo puede ser de naturaleza estadística, en la que la 
función de onda nos da información acerca de la probabilidad de encontrar 
el fotón en cualquier lugar determinado al realizar una observación de su 
posición. 

Algún tiempo antes del descubrimiento de la mecánica cuántica, los 
científicos se dieron cuenta de que la relación entre ondas luminosas y 
_ fotones debía ser de naturaleza estadística, pero lo que no comprendieron 
claramente es que la función de onda dé información sobre la probabilidad 
de que un fotón se encuentre en un determinado lugar y no sobre el número 
probable de fotones en dicho lugar. La importancia de esta distinción se 
puede poner de manifiesto del modo siguiente. Sea un haz de luz consti- 
tuido por un gran número de fotones dividido en dos componentes de 
igual intensidad. En la hipótesis de que la intensidad del haz esté relacio- 
nada con el número probable de fotones en él, encontraremos la mitad de 
fotones en cada una de las dos componentes. Si hacemos que ambas compo- 
nentes interfieran, deberíamos admitir que un fotón de una componente 
es capaz de interferir con uno de la otra. Algunas veces estos dos fotones 
tendrían que aniquilarse uno con otro, y otras veces deberían dar lugar a 
cuatro fotones. Esto contradice el principio de conservación de la energía. 

O e REALES 


Y 
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“ — La nueva teoría, que relaciona la función de onda con la probabilidad de un 
único fotón, supera la dificultad al suponer que el fotón está parcialmente 
en cada una de las dos componentes. Cada fotón interfiere Únicamente con- 

sigo mismo, Nunca pueden ocurrir fenómenos de interferencias entre dos 
ot 10H E 

La asociación de partículas y ondas que acabamos de exponer no se 
limita al caso de la luz; según la nueva teoría es de validez general. Todo 
tipo de partículas tiene una onda asociada en esta forma, y recíprocamente, 
a todo movimiento ondulatorio se le asocian partículas. Por tanto, todas las 
partículas son susceptibles de experimentar fenómenos de interferencias y 
todas las ondas tienen su energía en forma de cuantos. La razón de que 
estos fenómenos generales no sean más manifiestos se debe a la ley de 
proporcionalidad entre la masa o la energía y la frecuencia de las ondas, 
con un coeficiente de proporcionalidad tal, que para ondas de frecuencias 
ordinarias el cuanto asociado es extremadamente pequeño, mientras que 
para partículas como los electrones, o incluso la luz, la frecuencia de la 
onda asociada es tan grande que no es fácil verificar con ellas fenómenos 
de interferencias. 


4. Superposición e incertidumbre 


Probablemente el lector se encontrará insatisfecho con el intento reali- 
zado en las dos secciones precedentes, para compaginar la existencia de los 
“fotones y la teoría clásica de la luz. Puede alegar que se ha introducido 
una idea muy singular —la posibilidad de que un fotón esté parcialmente 
en cada uno de dos estados de polarización o en cada uno de dos haces 
separados — y que a pesar de ello no se ha dado ninguna imagen satis- 
factoria del proceso elemental de un fotón. Puede añadir que dicha idea 
no proporciona más información de la que se podría obtener mediante 
una consideración elemental donde los fotones estuvieran conducidos por 
ondas de forma vagamente definida. ¿Cuál es, pues, la finalidad de esta 
idea singular? 
Como respuesta a la primera crítica debe advertirse que el principal 
objeto de la ciencia física no es dar imágenes sino formular las leyes que 
rigen los fenómenos y su aplicación para descubrir nuevos fenómenos. 


Sí existe una imagen tanto mejor; pero el que exista cho 
de importanci 7 En el caso de los fenómenos atómicos, no puede 
esperarse que exista ninguna “imagen' en el sentido habitual de la palabra, 


que viene a significar un modelo que funcione esencialmente según la 
mecánica clásica. Sin embargo, se puede generalizar el significado de la 


palabra “imagen” de modo que incluya cualquier forma de considerar_las 

es ales que haga evidente” su coherencia. Con esta genera- 

Jración se puede adquirir gradualmente una imagen de los fenómenos 
Pp q | 8 7 


- atómicos al irse familiarizando con las leyes de la mecánica cuántica. 
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Respecto a la segunda crítica debe tenerse en cuenta que para muchos 
experimentos sencillos con la luz sería suficiente, a fin de explicar los resul. 
tados, una teoría elemental en la que ondas y partículas estuviesen rela- 
cionadas de una vaga forma estadística. La mecánica cuántica no aporta 
ninguna otra información sobre dichos experimentos. Sin embargo, en la 
gran mayoría de experimentos, las condiajones son demasiado complejas 


- para que sea aplicable una teoría tan elemental, y es necesario algún esquema 


más elaborado como el de la mecánica cuántica. El método de descripción 
que da la mecánica cuántica para Jos casos más complejos también se puede 


- aplicar a los casos sencillos, y si bien para ellos no es estrictamente necesario, 


- 


su estudio en estos casos constituye una introducción apropiada para el 
estudio del caso general. 

Todavía puede hacerse la siguiente crítica general del esquema com- 
pleto: al apartarnos del determinismo de la teoría clásica hemos introdu- 
cido una complicación considerable en la desci o 
naturales que no es deseable en absoluto. Esta complicación es innegable, 
pero queda compensada por la gran simplificación que nos ofrece el principio 
general de superposición de los estados que estudiaremos a continuación. 
Pero antes es necesario precisar el concepto clave de “estado” de un sistema 
atómico general. 

Sea un sistema atómico cualquiera, compuesto de partículas o de cuer- 
pos con propiedades dadas (masa, momento de inercia, etc.) que interaccio- 
nan de acuerdo con leyes de fuerza dadas. Existirán diversos movimientos 


posibles de las partículas o de los cuerpos compatibles con las leyes de 
fuerza. Cada uno de tales movimientos recibe el nombre es Sstado del 


sistema. Según las ideas clásicas, se podría especificar un estado dando el 
valor numérico de to todas las coord enadas. y yv velocidades de los diversos 


componentes del sistema en un i instante de tiempo, quedando asi completa- 
mente determinado el movimiento stema. Pero los razonamien- 





-tos de $3 y $4 ños indican que po podemos observar un sistema pequeño 


con tanto detalle como supone la O a Iimitación del poder de 
ob im ímero de datos que pueden 


atribuirse a Por tanto, el ndo de un sistema atómico tiene que 
caracterizarse por menos datos o por datorinás Imprecios que de coa 
completo de valores numéricos de todas Tas coordenadas y velocidades en un 
nstante_de tiempo. particular, . Cuando el sistema está constituido por 
un único fotón, el estado estará completamente especificado dando un estado 
de tráslación en el sentido de 83 y un estado de polarización en el sen- 
tido de $2. 

Puede definirse el estado. de un. sistema 









- sin que se _interfieran 0 O se coy Ad En la práctica, estas 
condiciones se pueden imponer mediante una preparación adecuada del 


sistema, que consista, por ejemplo, en hacerle pasar a través de una serie 
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de aparatos, tales como rendijas y polarímetros, y dejando el sistema inalte-* 


rado después de la preparación. La palabra “estado se emplea indistinta- 
mente para designar el estado en _un instante particulaz (después de la pre- 
paración) y el estado durante todo el tiempo posterior a la preparación. 
Para diferenciar ambos significados llamaremos a este último “estado de 
movimiento” cuando pudiera dar lugar a confusión. 

El principio general de superposición de la mecánica cuántica se aplica 


a los estados de todo sistema dinámico con cualquiera de los dos signifi- 


cados precedentes. Según dicho :principio existe una relación peculiar 
entre los estados, de forma que cuand stado 
definido, a la vez se puede considerar que está parcialmente en cada uno 


de una serie de estados. El estado original debe considerarse como el el 


rosu tigo, Ce Una superponción de esta serie de estádos, lo que”es in- 
é el punto de vista clásico. Es evidente que existen infi- 


nitas maneras de realizar dicha superposición para un mismo estado dado. 
Recíprocamente, todo conjunto de dos o más estados puede superponerse 
para dar lugar a un nuevo estado. El procedimiento de expresar un estado 
como el resultado de una superposición de un conjunto de otros estados 
es un procedimiento matemático que está siempre permitido, independien- 
temente de toda referencia a las condiciones físicas, como ocurre con el 
método de descomposición de una onda en componentes de Fourier. El 
que sea útil en un caso particular dependerá de las condiciones físicas 


particulares del problema que estemos tratando. 


En las dos secciones anteriores se han dado ejemplos del principio de 
superposición aplicado a un sistema constituido por un único fotón. En $ 2 
se consideran estados que sólo difieren respecto a la polarización, y en 
$ 3 estados 'que difieren únicamente sd ase al movimiento del fotón como 
un todo. 

La relación entre los estados de cualquier sistema que implica el prin- 
cipio de superposición es de tal naturaleza que no es posible expresarla 
mediante los conceptos físicos habituales. Desde el punto de vista clásico, 
no es posible imaginar que un sistema esté parcialmente en cada uno de dos 
estados dados, y que esto sea equivalente a estar completamente en otro 
estado distinto. Ello implica una idea completamente nueva a la que nos 
debemos ir acostumbrando, y sobre cuya base tenemos que construir una 
teoría matemática exacta sin disponer de ninguna imagen clásica precisa, 

Un estado formado por superposición de otros dos tendrá. propiedades 
que, en cierto sentido, serán intermedias entre las de ambos sistemas de 
partida, aproximándose en mayor o menor grado a las de cada uno, según 
se le haya atribuido un “peso” mayor o menor en el proceso de superposición. 
El nuevo estado estará completamente determinado por los dos estados de 
partida, cuando se conozcan sus pesos relativos en el proceso de superpo- 
sición y una diferencia de fase; el significado preciso de pesos y fases en 


e. general nos lo proporcionará la teoría matemática. En el caso de la polari- 
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zación de fotones, sus significados son los que nos dan la óptica clásica, y 
ásí por ejemplo, cuando. se superponen dos estados polarizados según 
direcciones perpendiculares con igual peso, el estado resultante puede estar 
polarizado circularmente en todas direcciones, rectilíneamente según un 


ángulo 0 elípticamente, según. la diferencia de fase. 


La naturaleza no clásica del proceso de superposición se pone clara- 
mente de manifiesto al considerar dos estados A y B, tales que exista una 
observación que aplicada al sistema en el estado A dé siempre el resultado 
particular a y aplicada al sistema en el estado B dé siempre el mismo 
resultado particular b distinto de a. ¿Cuál será el resultado de la observación" 
aplicada al sistema en el estado resultante de la superposición? La res- 
puesta es que unas veces obtendremos el resultado a y otras el b, según una 
ley probabilística que depende únicamente de los pesos relativos de A y B 
en el proceso de superposición. En ningún caso obtendremos un resultado 
distinto de a o b, El carácter intermedio del estado formado por la' super- 





posición reside en el hecho de que la probabilidad de obtener un resultado 


particular en una observación es intermedia entre las probabilidades corres- |. 
pondientes a los estados de partida,* y no en que el mismo resultado sea 
intermedio entre los resultados correspondientes a dichos estados. | 
Vemos, pues, que un abandono tan radical de las ideas clásicas, como el 
afirmar la existencia de relaciones de superposición entre los estados, sólo 


ha sido posible al tener en cuenta explícitamente la importancia de la alte- 


ración que acompaña a toda observación y la incertidumbre consiguiente 
en el resultado. Cuando se lleva a cabo una observación de un sistema 
atómico, en general no está determinado el resultado, es decir, que si repe- 
timos el experimento varias veces bajo idénticas condiciones, podemos 
obtener diversos resultados. Sin embargo, es una ley de la naturaleza el 


- hecho de que si repetimos el experimento un gran número de veces, cada 


resultado particular aparece en una fracción bien definida del número total 
de veces, y por tanto, existe una probabilidad determinada de obtenerlo. 


Esta probabilidad es lo que la teoría nos permite calcular. Únicamente está 
determinado el resultado del experimento en ciertos casos especiales, cuando 
la probabilidad de obtener un resultado es la unidad, 

- La hipótesis de que existan relaciones de superposición entre los estados 
nos lleya a establecer una teoría matemática en la cual las ecuaciones que 
definen el estado son lineales en las incógnitas. Como consecuencia de ello, 
se ha intentado establecer analogías ton sistemas de la mecánica clásica, 





* En general, la probabilidad de obtener un resultado particular con el sistema 
en el estado formado por superposición, no es siempre intermedia entre las probabilidades 
de los sistemas originales si éstas no son cero o uno; así pues existen limitaciones del 
“carácter intermedio” del estado formado por superposición. 
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tales como cuerdas y membranas vibrantes, cuyas ecuaciones son también 
lineales y que, por lo tanto, gozan de un principio de sup ición. Estas 
analogías han dado lugar al nombre de “mecánica ondulatoria“ton el que se 
“denomina a veces la mecánica cuántica. Pero es importante recordar que 
la superposición que-aparece en mecónica cuántica es de una naturaeza 
esencialmente distinta. de las que encontramos en la teoría clásica, como 
lo demuestra el hecho de que el principio cuántico de superposición exige 
que los resultados de observación estén indeterminados a fin de poder dar 
una interpretación física razonable. Por lo tanto, las analogías pueden pres- 
tarse a equívocos. 


5. Formulación matemática del principio de superposición 


Durante el presente siglo ha tenido lugar un profundo cambio en las 
opiniones que los científicos tenían sobre los principios matemáticos de la 
física. Anteriormente se suponía que la mecánica de Newton constituía 
la base para la descripción de todos los fenómenos físicos, y que por tanto, 
todo físico teórico debía contribuir al desarrollo y aplicación de estos prin- 
cipios. El reconocimiento de que no existe razón lógica alguna para que los 
principios newtonianos y otros principios clásicos tengan que ser válidos 
fuera del campo en que han sido comprobados experimentalmente, trajo 
consigo las primeras experiencias que pusieron de manifiesto 
necesidad de apartarse de estos principios. Los intentos de superar las 
divergencias se concretaron en la introducción de nuevos formalismos 
matemáticos, de nuevos sistemas de axiomas y reglas en los métodos de la 
física teórica.  ' 

La mecánica cuántica es un buen ejemplo de las nuevas ideas. En ella 

se exige que los estados de un sistema dinámico estén relacionados con las 
variables dinámicas de una forma nueva, ininteligible desde el punto de 


vista clásico. Los estados y las variables dinámicas deben estar re resentadas 
cantidades matemáticas de naturaleza diferente a las que se utilizan 
corrientemente en tisica. nuevo esquema constituirá una teoría física 


precisa cuando se hayan especificado todos los axiomas y reglas que rigen 
las cantidades matemáticas se hayan dado ciertas leyes que relacionen los 
hechos físicos con dichas cantidades, de tal manera que de unas condiciones 
físicas dadas puedan inferirse ecuaciones matemáticas y recíprocamente. En 
la aplicación de la teoría deberíamos disponer de cierta información física, 
que procederíamos a expresar en forma de ecuaciones entre las cantidades 
matemáticas. Con ayuda de los axiomas y las reglas de manipulación dedu- 
ciríamos nuevas ecuaciones y acabaríamos interpretándolas como condicio- 
nes físicas. La justificación de todo el esquema depende, aparte de su 
coherencia intrínseca, de la concordancia de los resultados finales con los 


-, experimentos. | pr 
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Empezaremos a construir el esquema considerando las relaciones mate- 
máticas entre los estados de un sistema dinámico en un instante de tiempo 
que se derivan de la formulación matemática del principio de superpo- 
sición. La superposición es un cierto proceso aditivo, e implica que los 
estados puedan sumarse de algún modo para dar nuevos estados. Por lo 
tanto, los estados tienen que estar asociados con cantidades matemáticas 
que puedan sumarse entre sí para dar cantidades de la misma clase. Las 
cantidades matemáticas más sencillas que disfrutan de esta propiedad son 
los vectores. Los vectores ordinarios definidos en un espacio de un número 
finito de dimensiones no son suficientemente generales para la mayoría 
de los sistemas dinámicos de la mecánica cuántica. Nos vemos obligados 
a generalizar los vectores a un espacio de infinitas dimensiones, con lo que 
el tratamiento matemático se hace complicado por razones de convergencia. . 
Sin embargo, de momento únicamente vamos a considerar propiedades que 
puedan ser deducidas sobre la base de un conjunto sencillo de axiomas, 
y dejaremos a un lado las cuestiones de convergencia y los temas relacio- 
nados con ella hasta que nos veamos obligados a tenerlos en cuenta, 

Es conveniente designar con un nombre especial a los vectores que se 
asocian a los estados de un sistema en mecánica cuántica, tanto si forman 
_ parte de un espacio de un número finito de dimensiones como de un 
espacio de infinitas dimensiones. Las denominaremos vectores ket, o sim- 
plemente kets, y los representaremos con el símbolo especial |>. Si queremos 
especificar un ket particular mediante una letra, por ejemplo la A, la colo- 
caremos entre los dos signos así |A>. La conveniencia de esta notación 
aparecerá clara cuando hayamos desarrollado todo el esquema. 

Los vectores ket se pueden multiplicar por números complejos y pueden 
también sumarse entre ellos para dar nuevos kets; por ejemplo, de los dos 
kets |A> y ¡B> podemos formar 


c1|A> + c2|B> =|R>, (Y) 


en donde c, y cz son números complejos arbitrarios. También es posible 
efectuar con ellos operaciones lineales más generales, como sumar una serie 
infinita de kets, o si tenemos un ket |x> que dependa de un parámetro x que 
puede tomar todos los valores de un cierto intervalo, integrar respecto a x - 
para obtener un nuevo ket 


Todo vector ket que se pueda expresar linealmente en función de los otros 
se dice que es dependiente de ellos. Se dice que un conjunto de kets es 
independiente, si ninguno de ellos se puede expresar linealmente en función 
de los otros. 


Ahora hacemos la hipótesis de que a cada estado de un sistema dinámico 
en un instante particular le-corresponde un ket, siendo la correspondencia 


tal que si un estado está definido como superposición de otros dos, su 
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correspondiente ket puede expresarse linealmente en función de los kets / 
correspondientes a dichos estados y recíprocamente. Por tanto, el estado R 
resulta de una superposición de los estados A y B si los correspondientes kets 
están ligados por (1). | 

La hipótesis anterior nos lleva a introducir ciertas propiedades del pro- y 
ceso de superposición, que de hecho son necesarias para que sea apropiada Ñ 
la palabra “superposición. Cuando se superponen dos o más estados, no _,¡p” 
importa el orden en que entran en el proceso de superposición, y así dicho” pS 
proceso es simétrico respecto a los estados que se superponen. Además, e 
de (1) deducimos que (exceptuando el caso en que c, o Cz sean nulos) si el 
estado R puede formarse por superposición de los estados A y B, el esta- A | 
do A puede formarse por superposición de B y R, y el B por superposi- 
ción de A y R. Las relaciones de superposición son, pues, simétricas respecto ys 
a los treswestados A, B y R. . 

Cuando un estado está formado por la superposición de otros dos se dice 
que es dependiente de ellos. Más en general, se dice que un estado es 
dependiente de un conjunto finito o infinito de otros estados, si su corres- 
pondiente ket es dependiente de los kets que corresponden a dichos estados. 

Se dice que un conjunto de estados es independiente si ninguno de los 
estados es dependiente de los otros. 

Para proseguir con la formulación matemática del principio de super- 
posición tenemos que introducir una nueva hipótesis; y afirmar que por 
superposición de un estado consigo mismo no podemos construir ningún | 
estado nuevo, sino que siempre obtenemos el mismo estado. Si el estado ori- 
ginal correspondía al ket |A>, al superponerle consigo mismo el estado 
resultante corresponde a 


c,14> + 0214) = (0, +03) 14», 

donde c, y cz son números. Puede ocurrir que C, +- C2 =0, en cuyo Caso 

el resultado de la superposición no representa nada en absoluto, pues las 
dos componentes se han eliminado mutuamente por un efecto de interfe- 
rencia, Nuestra nueva hipótesis exige que, salvo en este caso particular, el 
estado resultante sea el mismo que el original, y por tanto, (c, + C2)¡4> 
tiene que corresponder al mismo estado al que corresponde |4>. Pero 
€, + cz es un número complejo arbitrario, de donde deducimos que si mul-1Al 
tiplicamos el ket que corresponde a un estado por un número cmpio| 
arbitrario distinto de cero, el ket resultante corresponderá al mismo estado. 
Así, -pues, un estado viene caracterizado por la dirección de un ket, inde- 
A a es E 
sistema mico están en correspondencia biyectiva con las posibles di- 
recciones de los vectores ket, considerando como una sola las direcciones 
de |A> y de —|4>. 


Esta hipótesis mos muestra claramente la diferencia fundamental entre 


-la superposición que se da en mecánica cuántica y cualquier otra super- 
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posición clásica. En un sistema clásico para el que sea válido un principio 
de superposición, como por ejemplo una membrana vibrante, cuando se 
superpone un estado consigo mismo el resultado es un estado diferente, 
cuya amplitud de oscilación es distinta. No existe ninguna característica 


física en los estados de un sistema cuántico que corresponda a la amplitud 


de las oscilaciones clásicas, más que la relación entre las amplitudes en los 
distintos puntos de la membrana. Además, si bien existe un estado clásico 
de amplitud nula en todos los puntos de la membrana, que es el estado de 
reposo, no hay ninguno correspondiente a éste en un sistema cuántico, pues 
el ket nulo no corresponde a ningún estado de existencia. 

Dados dos estados que correspondan a dos kets |A> y |B», el estado más 
general que se puede formar por superposición de ambos corresponde a un 
ket |R> que viene determinado dando dos números complejos: los coeficien- 
tes C, y Ca de la ecuación (1). Si multiplicamos los dos coeficientes por un 
mismo factor (también complejo), el ket [|R> quedará multiplicado por dicho 
factor y el estado correspondiente será el mismo de antes. Por lo tanto, 
únicamente interviene en la determinación del estado R el cociente entre 
ambos coeficientes, Así pues, dicho estado queda determinado por un nú- 
mero complejo, o lo que es lo mismo, por dos parámetros reales. Por lo 
tanto, dados dos estados, por superposición de ambos podemos formar una 
doble infinidad de estados. 

Este resultado viene confirmado por los ejemplos explicados en $ 2 y $ 3. 


En el ejemplo de $ 2 existen dos únicos estados de polarización de un fotón 


independientes, pudiéndose elegir como tales dos estados de polarización 
rectilínea según direcciones paralela y perpendicular a una dada; por super- 
posición de ambos se puede formar una doble infinidad de estados de pola- 
rización, a saber, todos los estados de polarización elíptica, para cuya espe- 
cificación en el caso general son necesarios dos parámetros. Asimismo, en el 
ejemplo del $ 3, por superposición de dos estados de traslación de un fotón 
dados, podemos obtener una doble infinidad de nuevos estados de trasla- 
ción, pues el estado general así formado depende de dos parámetros, que 
pueden ser, por ejemplo, la relación de amplitudes de las dos funciones 
de onda que deben sumarse y su diferencia de fase relativa. Esta confir- 
mación muestra la necesidad de tomar coeficientes complejos en la ecua- 
ción (1). Si únicamente admitiéramos coeficientes reales, puesto que una 
vez conocidos |A> y |B> únicamente interviene el cociente de ambos coefi- 
cientes para especificar la dirección del ket |R> resultante, solamente po- 
dríamos construir una simple infinidad de estados por superposición de 


lA> y [B>. 


6. Vectores bra y ket 


Siempre que tenemos un conjunto de vectores en una teoría matemática 
cualquiera podemos construir un segundo conjunto de vectores, que los 
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X - 
matemáticos denominan vectores duales. Vamos a describir el método de 


obtenerlo en el caso de que los vectores de partida sean nuestros kets. 

Sea un número $ función de un ket |A>; es decir, que a cada ket |A> le 
corresponde un número ¿, y además exijamos que la función sea lineal, lo 
que quiere decir que el número que corresponde a |A> + |A”> es igual a 
la suma de los números que corresponden a |A> y a |4”>, y que el número 
que corresponde a c|A> es igual a c multiplicado por el número que corres- 
ponde a |4>», siendo c un factor numérico arbitrario. Entonces, el número $ 
que corresponde a |[A> puede ser considerado como el producto escalar de 
dicho |4> con un nuevo vector, existiendo tantos vectores nuevos como 
funciones lineales de los vectores ket. La justificación de que podamos 
considerar a $ de este modo, reside, como veremos más adelante (véanse las 
ecuaciones (5) y (6)), en el hecho de que los nuevos vectores pueden sumar- 
se entre ellos y multiplicarse por números dando nuevos vectores de la 
misma clase. A pesar de que los nuevos vectores sólo están dados cuando 
conocemos los-productos escalares con los vectores de partida, esto nos basta 
para construir una teoría matemática con ellos. 

Les denominaremos vectores bra o simplemente bras, y los represen- 
taremos con el símbolo <|, imagen simétrica del símbolo de un ket. Cuando 
queramos especificar un bra particular mediante una letra B, la escribire- 
mos entre los dos signos así <B|. El producto escalar del bra <B| y del 
ket -|A> lo escribiremos <B|A>, es decir, yuxtaponiendo los símbolos del 
bra y del ket, con el bra a la izquierda, y contrayendo las dos líneas 
verticales en una sola para abreviar. | 

Podemos considerar los símbolos < y > como tipos característicos de 
paréntesis. Un producto escalar <B|A> aparece ahora como una expresión 
entre paréntesis completos, * mientras que un bra <B| o un ket |A> son 
expresiones entre paréntesis incompletos. Por lo tanto, son válidas las si- 
guientes reglas: |toda expresión entre paréntesis completos expresa un 
número, y toda expresión “entre paréntesis incompletos expresa un vector, 
que será bra o ket según tenga el primer paréntesis o el segunda 

La condición de que el producto escalar de <B| y |4> sea una función 
lineal de [A> se puede escribir simbólicamente así: | 


<BKIA> +14) =<B]A> + <B]IA>, (2) 
<BliclA>) =<B]A>, (3) 


donde o es un número. 
Se considera que un bra está completamente definido, cuando se conoce 


- su producto escalar con cualquier ket, de modo que si el producto escalar 


* Los nombres de bra y ket, introducidos po Dirac, cuando se yuxtaponen forman 
la palabra bracket” que en inglés significa paréntesis. (N. del T.) 
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_de un determinado bra con todo ket es nulo, debe considerarse también 
nulo el bra. En símbolos, si 


<P[A> =0, para todo |A>, 4 
entonces <P| =0. (4) 


Definimos la suma de dos bras <B| y <B'| por la condición de que su 
producto escalar con cualquier ket |A> sea igual a la suma de los productos 
escalares de <B| y <B”] con |A>», 


(<B| + <B')/4> =<B|A> + <B7A>, (5) 


y el producto de un bra <B| con un número c por la condición de que su 
producto escalar con cualquier ket |A> sea igual a c multiplicado por el 
producto escalar de <B| y |A>, 


tc<B|HA> = c<B]A>. (6) 


Las ecuaciones (2) y (5) expresan que el producto escalar de un bra y un 
ket verifica la propiedad distributiva de la multiplicación, y las (3) y (6) 
indican que la multiplicación por factores numéricos verifica las propiedades 
algebraicas ordinarias. 

Los vectores bra, tal como los hemos introducido aquí, son de distinta 
naturaleza que los vectores ket, y hasta aquí, aparte del producto escalar, 
nó existe ninguna otra relación entre bras y kets. Ahora hacemos la hipótesis 


de que existe una correspondencia biyecti | ts, tal 
q nc biyectivo entre los: bras y los kets, ta 
ra que cor > es igual a la suma de los bras 


correspondientes a |A> y |A”> y el bra correspondiente a c[A> es igual a c 
multiplicado por el bra correspondiente a |A>, siendo 3 el complejo con- 
jugado de c. Emplearemos la misma letra para indicar un ket y su bra 
correspondiente. Así el bra que corresponde a |A> es <A]. 

La relación que existe entre un ket y su correspondiente bra justifica el 
que llamemos a cada uno el conjugado imaginario del otro. Nuestros bras 
y kets son cantidades complejas, puesto que se pueden multiplicar por 
números complejos obteniéndose vectores de la misma naturaleza que antes; 
pero son cantidades complejas especiales, ya que no pueden separarse en 
parte real y parte imaginaria pura. El procedimiento habitual de obtener 
la parte real de una cantidad compleja, que consiste en tomar la semisuma 
de dicha cantidad y su conjugada, es inaplicable debido a que los bras 
y los kets son de distinta naturaleza y no se pueden sumar unos con otros. 
Para llamar la atención sobre esta diferencia, utilizaremos las palabras “com- 
—plejo conjugado” cuando nos refiramos a números u otras cantidades comple- 
jas que puedan separarse en parte real y parte imaginaria pura, y las de 
“imaginario conjugado” para las que no disfruten de esta propiedad. Para 
las cantidades del primer tipo, cuando queramos indicar el complejo con- 
jugado de una cantidad dada, emplearemos la notación que consiste en 
colocar una raya sobre dicha cantidad. 
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Teniendo en cuenta la correspondencia biyectiva entre bras y kets, 
todo estado de nuestro sistema dinámico en un instante particular puede 
especificarse tanto por la dirección de un bra como por la de un ket, 
De hecho toda la teoría será simétrica en lo esencial respecto a bras y kets. 

Dados dos kets |A> y |B>, podemos formar con ellos un número <B|A>, 
producto escalar del primero con el imaginario conjugado del segundo. 
Tal número depende linealmente de |[A> y antilinealmente de |[B>. Depen- 

- dencia antilineal significa que el número que se obtiene con |B> + |B”> 
es igual a la suma de los números que se obtienen con |B> y con |B”>, y 
que el número que se obtiene con c|B> es igual a € multiplicado por el 
número que se obtiene con |B>. Hay otro procedimiento de formar un 
número que dependa linealmente de |A> y antilinealmente de (B>, que 
consiste dh tomar el número complejo conjugado del producto escalar de |B>, 
con el conjugado imaginario de |A>. Supondremos que estas dos números 
son iguales, es decir 


<BIA> = <AB) (7) 


Poniendo aquí |B> =|A>, resulta que el número <AJA> es real. Hacemos 
además la nueva hipótesis de que 


<AJA> > 0, | (8) 
salvo si JA> =0. | 
- En el espacio ordinario, dados dos vectores, se puede formar con ellos _ 
un Búmero — Su producto escalar — que es real y simétrico respecto a ellos. 
En él espacio de los vectorés bra o en el delos vectores ket, dados dos 
vectores Cualesquiera también podemos formar. un número — el producto A 


- “escalar de úño de ellos 3óñ él imaginario conjugado del otro — que ahora es 
complejo, y 36 Eanstorme-errsn complejo conjugado al cambiar” er orden 

- de-los vectores: Existe; por-tanto; un tipo-de perpendicularidad en estos 
espacios; que es. una generalización de la perpendicalaridad en el espacio 
ordinario. Diremos que un bra y un ket son ortogonales si su producto 
escaluF es nulo, y que dos bras o dos kets son ortogonales, si el producto 
escalar de uno de ellos por el imaginario conjugado del otro es cero. Además, 
diremos que dos estados de nuestro sistema dinámico son ortogonales, si 
sus vectores correspondientes también lo son. | 

Definimos la longitud de un bra <A| o de su ket imaginario conjugado |A)> 
como la raíz cuadrada del número positivo <A|A>. Si dado un estado que- 

- remos caracterizarlo mediante un bra o un ket, únicamente queda determi- 
nada la dirección del vector, pero el vector queda indeterminado en un 
factor numérico arbitrario. A menudo es conveniente elegir dicho factor 
de forma que el vector tenga longitud unidad. Este procedimiento se llama 
pormalización y el vector así elegido se dice que está normalizado. Sin 
embargo, aún no está completamente determinado el vector, pues se le . 


po , puede multiplicar por cualquier factor de módulo uno, es decir, cualquier 
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número de la forma e* con y real, sin modificar su longitud. A este número 
le llamaremos factor de fase. | ? 

Las hipótesis precedentes nos dan el esquema completo de las relacio- 
nes entre los estados de un sistema dinámico en un instante particular. 
Estas relaciones aparecen en forma matemática, pero implican condiciones 
físicas que nos llevarán, cuando hayamos desarrollado más la teoría, a 
resultados que se pueden expresar en términos de los datos de observación. 
Por ejemplo, el que dos estados sean ortogonales, no implica de momento 
más que una determinada ecuación en nuestro formalismo, pero tal ecuación 
implica a su vez una relación física definida entre los estados, que los pró- 
ximos desarrollos de la teoría nos permitirán interpretar en función de los 
datos de observación (véase el final de la pág. 36 y principio de la 37). 
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VARIABLES DINÁMICAS Y OBSERVABLES 


7. Operadores lineales 


En la sección anterior hemos considerado funciones lineales numéricas 
de kets, que nos han llevado al concepto de bra. Ahora consideraremos fun- 
ciones lineales vectoriales de kets, que nos llevarán al concepto de operador 
lineal. | | 

Sea un ket |F> función de un ket |A>, es decir, que a cada ket |A> le 
corresponde un ket |F>, y supongamos además que dicha función sea lineal, 
o lo que es lo mismo, que el ket |F> que corresponde a |A> + |4”> es igual 
a la suma de los kets |F> correspondientes a |A> y a |A”>, y que el ket |F> 
que corresponde a c|A> es igual a c multiplicado por el ket |F> correspon- 
diente a |A>, donde c es un factor numérico arbitrario. Bajo estas condicio- 
nes, podemos considerar el paso de |A> a |F> como la aplicación de un 
operador linea] a |A>. Si introducimos el símbolo € para el operador lineal, 
se puede escribir 


¡F> = 014», 7 


donde indicamos la aplicación de a sobre [A> como un producto de a 
por |A>. Establecemos la regla de que en tales productos el ket debe 
estar siempre a la derecha del operador lineal. Podemos expresar ahora las | 
condiciones de linealidad antes mencionadas mediante las ecuaciones 


(lA) + 14) =a/4> + aA0), A 
aíc[A>) =cajA>. 1 


Diremos que un operador lineal está completamente definido, si cono- 
cemos el resultado de su aplicación sobre cada ket. Por tanto, debemos 
considerar nulo a un operador lineal que aplicado a cualquier ket da cero, 
y asimismo diremos que dos operadores lineales son iguales, si dan el mismo 
resultado al aplicarlos a cualquier ket. | | 
-- También podemos sumar operadores, y definimos la suma de dos de 
ellos como aquel operador lineal que aplicado a cualquier ket da un resul- 
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tado igual a la suma de los kets que se obtienen al aplicar cada uno de los 
Operadores por separado a dicho ket, Así pues definimos « + f por 


la + BHA> =dA> + BLA) (2) 


_ para todo |A>. La ecuación (2) y la primera de las ecuaciones (1) nos indican 
¿Que el producto de operadores lineales por kets verifica la propiedad distri- 
butiva de la multiplicación. | 

Asimismo podemos multiplicar operadores lineales entre sí, y definimos 
el producto de dos operadores como aquel operador lineal que aplicado a 
cualquier ket da el mismo resultado que se obtiene al aplicar sucesivamente 
los dos operadores dados a dicho ket. Así pues, hemos definido el pro- 
ducto «8 como el operador lineal que aplicado a cualquier ket |4>, lo trans- 
forma en el ket que se obtiene aplicando primero £ a |A>, y después «a al 
resultado. En símbolos 


(aprlA> = al glA>). 


Esta definición es equivalente a la propiedad asociativa de la multiplicación 
del triple producto de a, £ y |A>, y nos permite por lo tanto escribir dicho 
producto sin paréntesis «B|A>. Sin embargo, este triple producto no da en 
. general el mismo resultado que se obtendría aplicando primero « a |A> y 
después $ al resultado, es decir, que en general af|A> es distinto de BalA>, 
y por tanto, en general, «8 es distinto de Sa. La propiedad conmutativa no 
es válida para la multiplicación de operadores Tevles Puodo ocurrir que 
“en casós especiales dos operadores Iineales E y y sean tales que En y ná sean 
iguales. En tal caso diremos que tan 1, O que É y y conmutan. 

Combinando las operaciones dadas de suma y multiplicación de opera- 
dores lineales se pueden formar sumas y productos con más de dos operado- 
res, y así podemos construir con ellos un álgebra. En dicho álgebra no 
será válida la propiedad conmutativa de la multiplicación, y podrá ocurrir 
también que el producto de dos operadores lineales sea nulo sin que lo sea 
 hinguno de los dos factores. Pero todas las demás propiedades del álgebra 
ordinaria serán válidas, incluidas las propiedades asociativa y distributiva 
de la multiplicación, como puede comprobarse fácilmente. 

Si tomamos un número k y lo multiplicamos por vectores ket, aparece 
como un operador lineal que se aplica a kets, pues verifica las condicio- 
nes (1) substituyendo k por «. Por tanto, un número es un caso particular 
de operador lineal. Tiene la propiedad de que conmuta con todo otro opera- 
dor lineal, lo que le distingue de un operador lineal general. | 

Hasta aquí únicamente hemos aplicado los operadores lineales a kets. 
Pero también pueden ser aplicados a bras, con el significado siguiente. 
Tomemos el producto escalar del bra <B| con el ket ajA>. Tal pro- 
ducto escalar es un número que depende linealmente de ¡A> y por lo tanto, 
dada la definición de bra, puede ser considerado como el producto escalar 
de |[A> por un cierto bra. Dicho bra depende linealmente de <B|, así que 
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' puedo considerarse como el resultado de aplicar cierto operador lineal a <B]. 


a a ad - Dicho operador lineal está determinado unívocamente por el operador li- 
> neal a de antes y es lógico decir que se trata del mismo operador lineal que 
+ actúa ahora sobre un vector bra. 


Una notación conveniente para indicar el bra que resulta de aplicar a 
al bra <B| es <Bla, y edi dicha notación, la ecuación que define <Bla es 


(«Bla A> = <B|LajA>) (3) | 


- para cualquier |A>, que expresa simplemente la propiedad asociativa de la 
multiplicación para el triple producto de <B|, a y |A>. Establecemos la regla 
general de que en todo producto de un bra y un operador lineal, siempre 
ha de estar el bra a la izquierda. Ahora ya podemos escribir el triple pro- 
ducto de <B|, « y [A> simplemente <BlalA> sin ningún paréntesis. Puede 
comprobarse fácilmente que la propiedad distributiva de la multiplicación 
es válida para los productos de operadores lineales y kets. | 
En nuestro esquema cabe todavía un nuevo tipo de producto, que es el 
producto de un ket y un bra con el ket a la izquierda |A><B]|. Para ver qué 
significa dicho producto, multipliquémoslo por un ket |P> arbitrario, que 
colocaremos a la derecha, y supongamos que es válida la propiedad asocia- 
tiva para esta multiplicación. Dicho producto vale entonces |A><B|P>, o 
sea el ket |A> multiplicado por el número <B|P>, y es función lineal del 
ket |P>. Por tanto, |A><B| aparece como un operador lineal que puede 
' actuar sobre kets. También puede actuar sobre bras, siendo su producto por 
un bra <Q| a la izquierda <O|A><B|, que es igual al número <Q|A> multipli- 
cado por el bra <B|. Debemos distinguir claramente entre los productos 
lA><B| y <B|A> de los mismos factores pero en orden inverso, siendo el 
último producto un número, como ya sabemos. 

Disponemos ahora de un esquema algebraico completo referente a tres 
clases de cantidades: vectores bra, vectores ket y operadores lineales. Pode- 
mos multiplicarlos entre sí de todas las formas indicadas, siendo válidas 
las propiedades asociativa y distributiva de la multiplicación en todos los 
Casos, pero no la propiedad conmutativa. En el esquema general sigue siendo 

válida la regla de notación dada en la sección anterior, de que toda expre- 
sión entre paréntesis completos, que tenga < a la izquierda y > a la derecha, 
representa mo número. mientras que toda exnresión entre paréntesis incom- 
pletos, que no tenga más que < o >, representa un vector. 
Respecto al significado físico del esquema, hemos supuesto siempre que 
_los bras y los kets, o mejor dicho las direcciones de dichos vectores, corres- 


ponden a los estados de un sistema dinámico en un instante particular. 
Ahora hacemos la nueva hipótesis de que los operadores lineales come 
ponden_ a las variantes Enémicos ee Cche ¿nstento ajo el nombre de 
variables dinámicas entendemos cantidades como las coordenadas, las com- 


ponentes de la velocidad, del momento y del momento angular de las par- 
tículas así como funciones de éstas — de hecho las variables que se emplean 
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en mecánica clásica —. La nueva hipótesis exige que dichas cantidades 
aparezcan también en mecánica cuántica, pero con la notable diferencia 
de que en ella están regidas por un álgebra en la cual no es válida la pro- 
piedad conmutativa de la multiplicación. E 

El hecho de que el álgebra de las variables dinámicas sea distinta en 
ambas teorías es una de-las diferencias más importantes entre la mecánica 
cuántica y la clásica, Más adelante veremos, a este respecto, que a pesar de 
esta diferencia fundamental, las variables dinámicas de la mecánica cuántica 
siguen gozando de muchas propiedades comunes con sus equivalentes clá- 
sicas, y que es posible construir una teoría análoga en gran parte a la 
clásica que constituye una excelente generalización de ella, 

Es conveniente utilizar la misma letra para especificar una variable 
dinámica y su correspondiente operador lineal. De hecho, consideraremos 
a ambos como una sola cosa, sin que ello dé lugar'a confusión. 


8, Relaciones conjugadas 


Nuestros operadores lineales son cantidades complejas, puesto que se 
pueden multiplicar por números complejos resultando nuevas cantidades 
de la misma naturaleza. Así pues han de corresponder en general a variables 
dinámicas complejas, es decir, a funciones complejas de las coordenadas, 
velocidades, etc. A fin de poder ver qué clase de operador lineal corres- 
ponde a una variable dinámica real, precisamos una elaboración más amplia 
de la teoría. | | | 

Consideremos el ket conjugado imaginario de <Pla. Dicho ket depende 
antilinealmente de <P| y, por tanto, depende linealmente de |P>. Por con- 
siguiente, puede ser considerado como el resultado de aplicar un cierto 
Operador lineal a |P>. A este operador lineal se le llama adjunto de a y le 
designaremos por Z. Con esta notación, el conjugado imaginario de <Pla 
es A[P>. | | 

En la fórmula (7) del capítulo 1 pongamos <Pja en lugar de <A], y A|P> - 
en lugar de |4>. El resultado es | 


<BJ81P> =PlaB> | (4) 


- Esta es una fórmula general, válida para todo par de kets |B> y |P> y para 
todo operador lineal «, que nos expresa una de las propiedades más utiliza- 

das del adjunto. | A 
_Substituyendo a por % en (4), resulta 


<B|A|P> = <Pla]B> = <BlajP>, 
después de haber utilizado otra vez (4) intercambiando [P> con [B>. Esto | 
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A es válido para todo ket |P>, de donde deducimos, con ayuda de (4) del 
capítulo 1, | | ? 


y puesto que esta ecuación es válida para todo bra <B|, podemos dedu- 
cir que 
dk =k4. 


Luego, el adjunto del adjunto de un operador lineal es igual al operador 
lineal de partida. Esta relación entre un operador y su adjunto es análoga . 
a la que existe entre un número y su complejo conjugado, y además pode- 
mos comprobar fácilmente que en el caso particular de que el operador 
lineal sea un número, su operador lineal adjunto es el número complejo 
conjugado del dado. Por lo tanto, queda justificado suponer que el adjunto 
de un operador lineal corresponde al complejo conjugado de la variable 
dinámica. Con este significado físico del adjunto de un operador lineal, 
podemos llamar al operador adjunto igualmente operador lineal complejo 
conjugado, lo que está de acuerdo con nuestra notación Z. 

Un operador lineal puede ser igual a su adjunto, en cuyo Caso se dice 
que es autoadjunto. Corresponde a una vie. inámica real, y por esto se 
_le denomina también operador lineal real. “Todo Operador lineal puede ser 
separado en parte real y parte imaginaria pura. Por esta razón para los 
operadores lineales se aplica la expresión “complejo conjugado” y no la de 
“imaginario conjugado. 

Evidentemente, el complejo conjugado de la suma de dos operadores 
lineales es igual a la suma de sus complejos conjugados. Para obtener el com- 
plejo conjugado del producto de dos operadores lineales « y 8 aplicamos 
la fórmula: (7) del capítulo I tomando 


<A| =<Pja, — <B|=<QIB, 
de forma que ' ¡A> = «r[P>, |[B> = BIQ>. 
El resultado es | 


<O|Ba¡P> =<PlaBlO> = <QlaBlP> 


deducido de (4). Puesto que la fórmula es válida para todo |P> y <Ql, re- 
sulta 


- Por lo tanto, el complejo conjugado del producto de dos operadores lineales 

es igual al producto de los complejos conjugados de los factores en orden 
inverso. 

Como simple ilustración de este resultado, debe hacerse notar que si 

E y y son reales, en general En no es real. Esto representa una diferencia 

importante con la mecánica clásica. Sin embargo, £n + ná sí que.es real, 

y lo mismo ocurre con (En — n£). Unicamente si £ y y conmutan, es también 


e . 
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general E”, siendo n cualquier entero positivo. 
Podemos calcular el complejo conjugado del producto de tres operadores 


réal En. Otra consecuencia es que si E es real, también lo es E? y más en . 


lineales aplicando sucesivamente la regla (5) para el complejo conjugado 


de dos de ellos. Tenemos 


«By =0(By) =P 2=Y BA, (6). 


Así pues, el complejo conjugado del producto de tres operadores es igual 
al producto de los complejos conjugados en orden inverso. Esta regla puede 
hacerse extensiva al producto de un número cualquiera de operadores. 

En la sección anterior vimos que el producto |A><B| es un operador 
lineal. Podemos obtener su complejo conjugado directamente de la defini- 
ción de adjunto. Multiplicando |A><B| por un bra cualquiera <P] obtenemos 
<P|A><B|, cuyo imaginario conjugado es 


ZPIA>|[B> = <AIP>B> = JB><A|P>. 


Por tanto, ¡A><B] = |B><A!. (7) 


Tenemos ahora distintas leyes que hacen referencia a complejos conju- 
gados y a imaginarios conjugados de productos, a saber, la ecuación (7) del 
capítulo 1, las ecuaciones (4), (5), (6) y (7) del presente capítulo, y la regla 
de que el imaginario conjugado de <P|e: es ¿]P>. Todas ellas pueden resu- 
mirse en una única regla fácil de recodar: el complejo conjugado o el 
imaginario conjugado de cualquier producto de vectores bra, vectores 
ket y operadores lineales se obtiene tomando el complejo conjugado o el 
imaginario conjugado de cada factor e invirtiendo el orden de todos los 
Jactores. Se puede comprobar fácilmente que esta regla es general, y que 
es válida también en los casos que no hemos considerado explícitamente. 

TEOREMA. Si E es un operador lineal real, y | 


EmiP> =0 (8) 
para un cierto ket |P>, siendo m un entero positivo, entonces 
| ElP> =0. 


Para demostrar el teorema tomemos en primer lugar el caso de m = 2. 


de la ecuación (8) resulta 
<P182|P> = 0, 


lo que nos dice que el ket E|P> multiplicado por su bra imaginario conju- 
gado <PlE es cero. Según la hipótesis (8) del capítulo 1, poniendo ElP> en 
lugar de ¡A>, resulta que E|P> tiene que ser nulo, Queda así probado el 
teorema para m-=— 2, | i 
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Ahora consideremos el caso m >.2 y llamemos 


E” 21P> =|Q>. 
Con esta notación, la ecuación (8) da 
E2/0> =0. 
Aplicando el teorema para m = 2, obtenemos 
ElQ> =0 
o su equivalente EnP> 0. (9) 


Reiterando el procedimiento mediante el que hemos obtenido la ecua- 
ción (9) a partir de la (8), obtendremos sucesivamente 


EP) =0, —E**P>=0, ..., ENP>=0,  ElP>=0, 


- quedando así demostrado el teorema en el caso general, 


9. Autovalores y autovectores 


Es preciso hacer un desarrollo más amplio de la teoría de operadores 
lineales y estudiar la ecuación 


alP> =alP>, | (10) 


en la que a es un operador lineal y a es un número. Esta ecuación se presenta 
con frecuencia de forma que « es un operador lineal conocido, y el número a 
y el ket |P> son las incógnitas, que debemos intentar determinar de modo 
que satisfagan a la ecuación (10), sin considerar la solución trivial |P> = 0. 
La ecuación (10) significa que al aplicar el operador «a al ket |P>, éste 
queda multiplicado por un factor numérico y no cambia de dirección, o 
bien que queda multiplicado por el factor cero y deja de tener dirección. 
Por supuesto, dicho operador «a aplicado a otros kets cambiará tanto sus 
longitudes como sus direcciones. Tengamos presente que en la ecuación (10) 
lo único que importa de |P> es su dirección. El multiplicar |P> por un 
número distinto de 0, no afecta a la cuestión de si satisface o no a (10). 
Junto a la ecuación (10), consideraremos la ecuación imaginaria con- 


jugada | 
| <Qla = 2<Ol, (11) 


en la que b es un número. Aquí las incógnitas son los números b y los bras 
<Q| que no sean el cero. Dado que las ecuaciones (10) y (11) son de impor- 
tancia primordial para la teoría, es conveniente dar un nombre especial al 
tipo de relación entre las cantidades a que day lugar. Si una terna a, |P> 
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de - y a verifican (10), diremos que a es un autovalor (eigenvalue) * del operador ' 

lineal «4 o de su correspondiente variable dinámica, y asimismo que |P> 
es un autoket (eigenket) del operador lineal o de la variable dinámica en 
cuestión. Además diremos que el autoket |P>, pertenece al autovalor a. 
Análogamente, si una terna a, <Q! y b verifican (11), diremos que b es un 
autovalor de « y que <Q] es un autobra (eigenbra) perteneciente a dicho 
autovalor. Desde luego, las expresiones de autovalor, autoket y autobra 
únicamente tienen sentido con respecto a un operador lineal o a una varia- 
ble dinámica. 3% 


distinto de cero, el ket resultante es un nuevo autoket perteneciente al 
mismo autovalor al que pertenecía el ket de partida. Pueden existir dos o 
nrás hutokets de un operador lineal independientes que pertenezcan a un 
mismo autovalor; así por ejemplo, la ecuación (10) puede tener varias 
2 soluciones |P1>, |P2>, |P3>, ... que pertenezcan a un mismo autovalor a, 
¿"y que sean independientes. En tal caso es evidente que cualquier combi- 
mE nación lineal de dichos autokets también es un autoket que pertenece al 
dl mismo autovalor del operador lineal, es decir que-" " 


cilP1> + calP2> + cg]P3> + ... 


es también solución de (10), siendo c;,, Cz, Cz, ... números cualesquiera. 

E En el caso particular de que el operador líneal « de las ecuaciones (10) 
e y (11) sea un número k, evidentemente todo ket |P> y todo bra <Q| satis- 
A facen dichas ecuaciones con a y b iguales a k. Por tanto, todo número, con- 
siderado como operador lineal, tiene un único autovalor, y todos los kets y 
todos los bras son autovectores suyos pertenecientes a dicho autovalor. 

La teoría de autovalores y autovectores de un operador lineal a que no | 
sea real, no tiene gran aplicación en mecánica cuántica"'Así pues, a estos 
efectos, nos limitaremos en adelante a considerar operadores lineales reales. 
| Poniendo en lugar de « el operador lineal real £, resultan en lugar de las 

Y ecuaciones (10) y (11), 





ElP> = alP>, (12) 
<QlE = <Q. Ñ (13) 


Podemos deducir inmediatamente tres importantes resultados. 

(1 Los autovalores son todos reales. Para demostrar que todo a que 
verifique (13) es real, multipliquemos (12) por el bra <P] a la izquierda, 
resulta | 

<PIEIP> = axP|P>. | 


* Algunas veces se utiliza la palabra “propio” (proper) en lugar de “auto” (eigen), 
pero esto no es del todo satisfactorio ya que las palabras “propio” e “impropio” se utilizan ¡ 
a menudo con otros significados. Por ejemplo, en $8 15 y 48 se utilizan las expresio- 
nes “función impropia” y “energía propia”. | | 
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Ahora, con ayuda de (4), en la que substituimos <B| por <P| y a por el 
operador lineal real £, resulta que el número <P|£|P> tiene que ser real, y 
como en virtud de $ 6 <P|P> es real y distinto de cero, deducimos que a es. 
real. Análogamente, multiplicando (13) por |[O> a la derecha, podríamos 
- demostrar que b también es real. 

Dada una solución de (12) formemos la ecuación imaginaria conjugada, 
que es 
| <PI8 = axP| 


ya que tanto £ como a son reales. Esta ecuación, conjugada imaginaria 
de (12), nos proporciona una solución de (13) tomando <Q| =<P| y b=a. 
De aquí se deduce que 

| (u) Los autovalores asociados a los autokets, so: son los mismos que los 
autovalores asociados a los autobras. “$ -¿mA” 

(m) El imaginario conjugado de un autoket es un autobra que pertenece 
al mismo autovalor, y recíprocamente. El último resultado nos permite 
decir con razón que el estado que corresponde a cualquier autoket o a su 
bra imaginario conjugado es un autoestado de la variable dinámica real É. 

Los autovalores y los autovectores de algunas variables dinámicas reales 
se utilizan ampliamente en mecánica cuántica y, por tanto, es conveniente 
utilizar una notación sistemática para indicarlos. La que vamos a exponer 
a continuación es adecuada para la mayoría de las aplicaciones. Si E es una 
variable dinámica real, sus autovalores los designaremos por E”, E”, E", etc. 
Así una letra sirve para designar una variable dinámica real o un operador 
lineal real, y la misma letra con primas o índices indica un número, que es 
un autovalor del operador que simboliza la letra. De este modo, un auto- 
vector puede especificarse con el autovalor a que pertenece. Así |E”> 
representa un autoket que pertenece al autovalor ¿” de la variable diná- 
mica E. Cuando consideremos explícitamente un caso en que a un autovalor 
de una variable real le corresponda más de un autoket, los distinguiremos 
unos de otros mediante un nuevo símbolo, o incluso por más de uno. Por 
tanto, si tratamos con dos autokets que pertenezcan al mismo autovalor E, 
les designaremos |E'1> y |8'2>. 

TEoREMA. Dos autovectores de una misma variable dinámica real que 
pertenezcan a distintos autovalores son ortogonales. 

Para demostrar el teorema, consideremos dos autokets |E”> y 18%> de 
una misma variable real E, que pertenezcan respectivamente a los autova- 
lores E” y £”. Tendremos las ecuaciones 


EE) = EE, (14 
EE") = ENE). 65) 


) 
Tomando la ecuación imaginaria conjugada de (14) obtenemos 


-<818 = EE. 
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que multiplicada a la derecha por [£”> nos da 
<EIEIE") = EEE" 

y multiplicando la (15) por <£” a la izquierda 
<ETEE"> =E<ETE", 


Restando una de otra obtenemos 


(E —EKETE”> =0, (16) 


que nos demuestra que si ¿” +4 5”, entonces <£']5”> = 0, o sea que los auto- 


- vectores |£”> y |5”> son ortogonales. A este teorema se le da el nombre de 
teorema de ortogonalidad. 


Hemos considerado propiedades de los autovalores y de los autovectores 
de un operador lineal real, pero no nos hemos preguntado si, dado un 


operador lineal real, existen autovalores y autóvectores, ni tampoco cómo 


se pueden hallar en caso de que existan, Esta cuestión, en general, es muy 
difícil de resolver. Sin embargo, existe un caso particular muy útil que se 
puede estudiar con facilidad, y es cuando el operador lineal real £ en 
cuestión satisface una ecuación algebraica 


p(E) =E" 4 aj E"? ar... + doi 0, (17) 


en la que los coeficientes a, sean números. Esta ecuación significa, como es 
sabido, que al aplicar el operador lineal p(F) a cualquier ket o a cualquier 
bra da como resultado cero. 

Sea (17) la ecuación algebraica más sencilla ans satisface E. Vamos a 
demostrar que 

(a) El número de autovalores de E es a. 


(8) Existen tantos autokets de £ que todo ket puede expresarse lineal- 
- mente en función de .ellos. 


La forma algebraica ¿(5) puede ser descompuesta en n factores linea- 


les así | 
p(8) = (E — c1)(É — ca)J(é — Ca) (8 — Cn) - (18) 


siendo los c; ciertos números que no tienen por qué ser todos distintos. Esta 


descomposición puede llevarse a cabo tanto si £ es una variable algebraica. 


ordinaria como si es un operador, ya que en (18) no hay ningún elemento 
que no conmute con E. Sea y,(%) el cociente de dividir ¿(%) por (E — c,), 
es decir 


P(E) = (E—c)y Aé) (r= 1, 2 3, ..., n). 
Entonces, para todo ket |P> se tiene 
(E—cdkE)P> = HEIP> =0. (19) 
Pero yr(5)¡P> no puede ser nulo para todo ket|P>, ya que entonces también 
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sería nulo y»(8), en cuyo caso E satisfaría una ecuación algebraica de grado 
n— 1, lo que está en contra de la hipótesis de que (17) es la ecuación más 
sencilla que satisface E. Si elegimos |P> de forma que y.(8)|P> no sea nulo, 
la ecuación (19) nos muestra que x-(8)1P> es un autoket de ¿ perteneciente 
al aútovalor c,. El argumento es válido para todo valor de r desde 1 hasta n 
y, por tanto, cada uno de los c, es un autovalor de E. Además, ningún otro 
número puede ser autovalor de E, ya que si £” es un autovalor cualquiera, 
que pertenece al autoket |5”>, se tendrá 


518) = E1ES 
de donde podemos deducir 
$818 = ENE, 


y puesto que el primer miembro se anula, debe ser p(8') =0. 

Para completar la demostración de («) hemos de ver que todos los c; 
que figuran en (18) son distintos. Supongamos que no lo fueran, y que C, es- 
tuviera repetido m veces, siendo m > 1. En tal caso ¿(8) sería de la forma 


p(5) = (E — C.)"0(8), 
donde 0(%) sería una función racional y entera de E. De (17) deducimos 
(E —C,)"0AEJA> =0 (20) 


que se verifica para todo ket |A>. Puesto que c, es un autovalor de ¿, tiene 
que ser real y, por tanto, E —c, es un operador lineal real. Pero la ecua- 
ción (20) es de la misma forma que la (8) con £—c, en lugar de É y 
(E) A> en lugar de |P>. En virtud del teorema relacionado con dicha ecua- 
ción (8), podemos deducir 


(E — cs) AE)A> =0. 


Y puesto que el ket |A> es arbitrario, resulta 


(8 — cJ0(%) =0, 


que está en contradicción con la hipótesis de que (17) es la ecuación más 
sencilla que verifica ¿. Así pues, los c; son todos distintos y queda demos- 
trado (a). 

Sea xr(cr) el número que se obtiene al substituir £ por c, en la expresión 
algebraica de yr(8). Puesto que todos los c, son distintos, x»(c,) no puede 
ser nulo. Consideremos la expresión 


XA AS) 

—— — 1, 21 
| lod ON e 
Si en ella substituimos E por c,, todos los términos de la suma se anulan 
con excepción del término para el que r =s, pues para rs, xr(8), contiene 
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el factor ($ —c,), y el término r=s vale 1 y se cancela el —1. Por tanto, la 


expresión (21) se anula cuando ponemos en lugar de £ cualquiera de los 
1; DÚMEeTOS Cy, Cz, ..., Cn, y al ser de grado n— 1 en E, debe ser idéntica- 
mente nula. Así pues, si aplicamos el operador lineal (21) a un ket arbi- 
trario |P> e igualamos el resultado a cero, obtenemos 


1P> =3 5 8)P>. (22) 


Según (19), cada término de esta suma que no sea nulo es un autoket de E. 
La ecuación (22) expresa un ket arbitrario |P> en función de autokets de E, 
quedando así demostrado (8). | 

Como ejemplo sencillo podemos considerar un operador lineal real « 
que satisfaga a la ecuación | 


=> j (23) 


En este caso y tiene los dos autovalores 1' y —1. Todo ket |P> puede 


expresarse así ? 
[P> =3(1 + 0]P> + 4(1 — 0)|P>. 


Es fácil ver que los dos términos del segundo miembro, si no se anulan, son 
autokets de s, que pertenecen respectivamente a los autovalores 1 y —l. 


10. Observables 


Hemos hecho un conjunto de hipótesis acerca de cómo se representan - 
los estados y las variables dinámicas en la teoría matemática. Dichas hipóte- 


sis por sí solas no constituyen leyes de la naturaleza, pero en cuanto hagamos 


nuevas hipótesis acerca del significado físico de la teoría, aparecerán como 
tales. Las nuevas hipótesis tienen que establecer relaciones entre los resul- 
tados de observación por un lado, y las ecuaciones del formalismo mateméá.- 
tico por el otro. 

Toda observación consiste en medir ung variable dinámica. Desde el 
punto de vista físico es evidente que el resultado de dicha medición debe 
ser siempre un número real, y así supondremos que cualquier variable 
dinámica que podamos medir debe ser una variable dinámica real. Puede 
pensarse que sería posible medir una variable dinámica compleja midiendo 
su parte real y su parte imaginaria por separado, pero esto llevaría con- 
sigo dos medidas o dos observaciones. Si bien en mecánica clásica es posi- 
ble, en mecánica cuántica no lo es, pues en general las medidas interfieren 
entre sí —no se puede admitir que dos observaciones se realicen exacta- 
mente a la vez, y si se hacen una detrás de otra en rápida sucesión, gene- 
ralmente la primera altera el estado del sistema e introduce una indeter- 
minación que afecta a la segunda. Por lo tanto, debemos exigir que las 
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Ad áriables dinámicas que se pueden medir sean reales, y la condición para. 
ello en mecánica cuántica es la de $8. Sin embargo, no toda variable 
dinámica real puede ser medida. Como veremos más adelante, es necesaria 
hi restricción. 
—— Hagamos ahora algunas hipótesis acerca de la interpretación , física de 
la teoría. Si el sistema dinámico está en un autoestado de una variable 
dinámica real E perteneciente al autovalor E”, entonces estamos totalmente 
seguzos de que el resultado de medir E es él número E'. Recíprocamente, La 
si el sistema está en un estado tal que al medir una variable dinámica real E | Md b 
estamos completamente seguros de obtener un resultado particular deter- 
minado (y no distintos posibles resultados según una ley probabilística, 
como ocurre en general), entonces el estado es un autoestado de E, y el | 
resultado de la medida es el autovalor de E a que pertenece dicho auto- 7 
estado. Dado que los autovalores de los operadores lineales reales, son | 0) 
| siempre números reales, estas hipótesis son viable 7 
| señalemos algunas consecuencias inmediatas de estas PA . tene- 
mos dos o más autoestados de una variable dinámica real £ pertenecientes 
Y a un mismo autovalor E”, todo estado formado por uperposición de ellos 
también será un autoestado de E perteneciente al autovalor E/. De aquí 
se deduce que si el sistema está en un estado formado por superposición de 
otros varios para los que estamos completamente seguros de que al medir E 
en cada uno de ellos obtenemos un mismo resultado E”, entonces al medir 
E en él obtenemos también con toda seguridad el resultado E”. Esto nos da 
cierta luz acerca del significado físico del principio de superposición de los 
estados. Otra consecuencia es que dos autoestados de E pertenecientes a 
distintos autovalores son ortogonales. De aquí se deduce que si tenemos dos 
estados de un sistema y estamos completamente seguros de que al medir E 
en cada uno de ellos obtenemos un único resultado, distinto para uno y 
otro, entonces los dos estados son ortogonales. Esto nos da, a su vez, alguna 
luz acerca del significado físico de la ortogonalidad de los estados. 

_Cuando medimos una variable dinámica real E, la alteración que lleva - 
consigo el acto de la medida produce un cambio del estado del sistema 
dinámico. Si llevamos a cabo una segunda medición de la misma variable 
dinámica E inmediatamente después de la primera, por continuidad. física 
el resultado debe ser el mismo de antes. Por tanto, después de haber reali- | 
zado la primera medición no hay ninguna indeterminación en el resultado pa a 
de la segunda, o sea que después de realizar la primera medición, el sistema 
está en un autoestado de la variable dinámica E, siendo el autovalor al ques 5% j >= 
pertenece dicho estado el resultado de la primera medida. Esta conclusión Ed eo 
tiene que continuar siendo válida aunque no lleyemos a cabo la segunda 713">-< * 
medida. Así vemos que toca medics obliga e sistema a saltar a yn auto- y) de. 

estado de la variable dinámica medida, que además pertenece a un autova- y, Y | 
[Sr igual al resultado de la medida. ( os 
Podemos concluir que cualquiera que sea el estado en que se encuentre di 
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el sistema, todo resultado de medir una variable dinámica real es uno de 
_sus autovalores. Y recíprocamente, todo autovalor es un posible resultado 
de medida de la variable dinámica para algún estado del sistema, ya que 
con toda probabilidad será el resultado de la medida cuando el estado del 
sistema sea un autoestado perteneciente a dicho autovalor. Todo esto nos 
muestra el significado físico de los autovalores. El conjunto de autovalores 
de una variable dinámica real recisamente espectro de Tas 
Osi da de code de dida ved dinámica, y por esta razón 
e A de los autovalores constituye un problema importante. 
“Asimismo hacemos la hipótesis siguiente sobre lá interpretación física-, 
de la teoría: cuando medimos una cierta variable dinámica real E con el sis- | 
tema en un estado determinado, los estados a los que puede saltar el; 
sistema a causa de la medida son tales que el estado a originar es dependiente, 
ero como por otro lado los estados a los que puede saltar el 
sistema son todos autoestados de £, resulta que el estado original es depen- 
- diente de autoestados de E. Teniendo en cuenta que el estado original 
_ Puede ser cualquiera, podemos concluir que todo estado es dependiente 
de autoestados de ¿."Si definimos un conjunto completo de estados como 
aquel para el que todo estado es dependiente de los estados del conjunto, 
nuestra conclusión también se puede formular así: los autoestados de E 
onstituyen O O | | 
No toda variable dinámica real tiene Suficientes autoestados para que 
constituyan un conjunto completo. Pero aquellas cuyos autoestados no 
forman un conjunto completo no representan cantidades que s 
medir. Así obtenemos una nueva condición que debe verificar toda variable 
dinámica, además de la de ser real, para que se pueda medir. Toda varia- 
ble dinámica real cuyos autoestados constituyan un conjunto.completo, la 
denominaremos con el nombre genérico de obsergable. Por tanto, toda can- 
tidad que se pueda medir es un observable AO 
La cuestión que se pianterahóra es si todo observable puede ser medido. 
La respuesta teórica es que sí. En la práctica puede resultar muy difícil o 
incluso puede estar fuera del alcance del ingenio del experimentador, el 
imaginar un aparato capaz de medir un observable particular, pero según 
la teoría siempre existe. | 
- Examinemos matemáticamente la condición para que una variable di- 
námica real E sea un observable. Sus autovalores pueden constituir un 
conjunto discreto (finito o infinito) de números o bien un conjunto formado 
por todos los números de un cierto dominio de medida no nula, como todos 
los números comprendidos entre a y b. En el primer caso, la condición de 
que todo estado sea dependiente de los autoestados de E es que todo ket 
pueda expresarse como combinación lineal de autokets de E. En el segundo 
caso la condición debe modificarse, ya que en lugar de la suma puede 
aparecer una integral; en este caso, todo ket |P> ha de poderse expresar 
como una integral de autokets de E. 
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|P> = f 1ENdE,, SS (24) 


É , coda I8'> son autokets de E pertenecientes al autovalor E”, y la integral 


- se extiende al dominio de los autovalores a los que pertenecen los autokets 


de £ de los que depende dicho ket. Pero no todo ket que dependa de 


Autokets de £ puede expresarse en la forma que indica el segundo miembro 
de (24), pues por ejemplo uno de los mismos autokets no se puede expresar 
así, y más en general, ocurre lo mismo con cualquier suma de ellos. Por 


tanto, la condición de que los autoestados de E constituyan un conjunto . 


completo tiene que formularse. diciendo que todo ket |P> ha de poderse 
_ expresar como una integral más una suma de autokets de £, o sea 


¡P>=/f [yc de" + E lira», (25) 
Los |£'c> que figuran en la integral y los |$"d> de la suma son autokets de E, 


-—. y les hemos añadido las letras c y d respectivamente para indicar que no 


tienen por qué ser iguales aunque los autovalores E” y £” coincidan. La inte- 
gral se extiende a todo el dominio de valores, y la suma a un subconjunto * 
discreto cualquiera. Si esta condición se satisface en el caso de que los 
autovalores de £ constituyan un dominio de medida no nula, entonces E es 
- un observable. 

Puede darse un caso más general aún, cuando los autovalores de E son, 
además de todos los números de un cierto dominio de medida no nula, un 

- conjunto discreto de números situado fuera de dicho dominio. En este caso, 
la condición de que ¿ sea un observable sigue siendo que todo ket pueda 
expresarse en la forma que indica el segundo miembro de (25), pero advir- 
tiendo que ahora la suma respecto de r se extiende además de a un subcon- 
junto discreto cualquiera de los valores del dominio como, antes, a los ' 
- números del conjunto discreto situado fuera de dicho dominio. 

A. menudo resulta muy difícil establecer desde el punto de vista matemá- 
tico si una variable dinámica real concreta satisface o no la condición para - 
ser un observable, ya que, en general, el problema de hallar los autovalores 
y los autovectores es muy difícil de resolver. Sin embargo, pueden existir 
poderosas razones experimentales « que nos permitan admitir que dicha varia- 
ble dinámica puede ser medida, y en tal caso supondremos lógicamente que 
es un observable pese a' carecer de una demostración matemática, Esto lo 
haremos con frecuencia durante el desarrollo de la teoría, y así supondremos 
por ejemplo, que la energía de cualquier sistema dinámico *s siempre un 
observable, si bien con los métodos actuales del análisis matemático sólo se 
ha podido demostrar en casos muy sencillos, 

En el caso particular de que la variable dinámica sea un número, todo 
estado es autoestado de él, y evidentemente dicha variable dinámica es un 
' observable. Al medirlo obtendremos siempre el mismo resultado, o sea que 

se trata de una constante física, od por ejemplo la carga del electrón. 
Y | 
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Por tanto, una constante física se puede considerar en mecánica cuántica 
bien como un observable con un único autovalor o como un simple número 


Que aparece en las ecuaciones, siendo ambos puntos de vista completamente 


.equiválentes. 

Si la variable dinámica real satisface una ecuación algebraica, entonces 
el resultado (8) de la sección anterior nos dice que la variable dinámica 
en cuestión es un observable. Un observable de este tipo tiene un número 
finito de autovalores. Recíprocamente, todo observable que tenga un nú- 
mero finito de autovalores satisface una ecuación algebraica, pues si el 


- observable E tiene como autovalores £”, E”, ..., E”, entonces se verifica 


(E—EN(E—8) ...(E—E"|P> =0 


para todo [P> que sea autoket de E y, por lo tanto, también para cual- 
quier |P>, pues como £ es un observable todo ket puede a como 
suma de autokets de E, luego e 


(65687 ... (689) =0.. (28) 


Como ejemplo tomemos el operador lineal |A><A], siendo |A> un ket 


- normalizado. Según (7), dicho operador es real y su cuadrado vale 


(A><AJ? = [A><AJA><A] = [AA] (27) 
ya que <AJA4> — 1. Es decir, que su cuadrado es igual a sí mismo y, por lo 


tanto, satisface una ecuación algebraica y, en consecuencia, es un observable. 


Sus autovalores son 1 y 0; |[A> es el autoket que pertenece al autovalor 1 y 
todos los kets ortogonales a |A> son autokets que pertenecen al autovalor 0. 
La medición de dicho observable dará con toda certeza 1 cuando el sistema 
dinámico esté en el estado correspondiente a |¡A>, y O cuando esté en un 
estado cualquiera ortogonal a éste. Así pues, el observable representa la 
cantidad que determina si el sistema está en el estado |A> o no. 

Antes de concluir esta sección vamos a examinar las condiciones que se 


- necesitan para que una integral como la de (24) tenga sentido. Sean |X> 


e |[Y> dos kets que puedan expresarse como integrales de autokets del obser- 


| vable E, 


IX) = j Eodz, | = f lE"y>d5”, 


donde x e y sirven para distinguir ambos integrandos. En este caso, tomando 


- la ecuación imaginaria conjugada de la primera y multiplicándola por la 


segunda tenemos 


«am =$ | «ey dz az”. (98) 
Consideremos la integral | R 


j mE) de”. | (29) 


- Según el teorema de ortogonalidad, el integrando se anula en todo el inter- 
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3 Mi valo de integración excepto en el punto E” = 8'. Si el integrando fuera 
:+ finito en dicho punto, la integral (29) se anularíáP% y si ello ocurriese para 
todo E'*según (28) resultaría <X|Y> igual a cero. Pero como en general <X[Y> 


a : no es nulo, <E'x|5'y> ha de ser en general infinito, de tal manera que (29) 


resulte distinto de cero y finito. El tipo de infinito que esto exige se discutirá 
en $15. En 
Implícitamente habíamos supuesto hasta ahora que nuestros bras y kets 
tenían longitud finita y que sus productos escalares eran finitos. Ahora nos 
vemos obligados a limitar dicha condición cuando tratamos con autovecto- 
res de un observable cuyos autovalores forman un dominio de medida no 
nula. Si no la limitásemos no.sería posible considerar casos en que los auto- 
valores constituyeran un dominio de medida no nula, y nuestra teoría re- 
sultaría insuficiente para una gran parte de los problemas reales. 
Tomando |Y> = |X> en (28), resulta que en general <£'x]8'x> es infinito. 
Para |8'x> +0 tomaremos 


Fuexgra az” >0, (30) 


como el axioma correspondiente a (8) de $ 6 para los vectores de longitud 
infinita. | | 

El espacio de los bras o el de los kets, cuando exigimos que los vectores 
tengan longitud finita y que los productos escalares sean finitos, constituye 
lo que los matemáticos denominan un espacio de Hilbert. Los bras y los kets 
que empleamos aquí dan lugar a un pomo de lo que corres- 
ponde a un espacio de Hilbert. | 

Veamos. ahora que, si exigimos que no haya más que un término en 
la suma relativo a un mismo autovalor, la descomposición de un ket |P> en la 
forma señalada en (25) es única. Para demostrarlo supongamos que, por el 
contrario, existieran dos posibles descomposiciones distintas de |P>. Restan- 
do una de la otra, obtendríamos una ecuación de la forma 


0=/ ¡Ya de! + 3 lE"b», (31) 


en la que a y b son nuevos símbolos para distinguir los autovectores resul- . 
tantes, y donde el subíndice s incluye todos los términos que hayan quedado 
después de restar. Si en la suma de (31) hubiese un término relativo a un 


autovalor £* que no forme parte del dominio continuo, multiplicando dicha - : 


ecuación por <E*b| a la izquierda y aplicando el teorema de ortogonalidad, 
resultaría 


0 =<E*blE*b>, 


lo que está en contra de la hipótesis (8) de $ 6. Asimismo, si el integrando 
de (31) fuera distinto de cero para algún autovalor E” que no figurase en la 
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- suma para ningún valor de s, multiplicando (31) por <5”a| a la izquierda 
y aplicando el teorema de ortogonalidad, resultaría 


0= | <k"alga> ds, 


lo que va en contra de (30). Por último, si en la suma de (31) existiera un 
- término relativo a un valor propio E* que figurase en el dominio de inte- 
. gración, multiplicando la ecuación por <g*b| a la izquierda, resultaría 


0= | <EtblEfa) del + <EbIED> (32) 
y multiplicando por <é*a| a la izquierda 


” 


0= | <Etajeta> de + <EtalEtb). (39) 


Pero la integral de (33) es finita, luego, también deben serlo <E*alE*b> y 
<E*blEta>. Esto implica que la integral que figura en (32) sea nula y, por 
lo tanto, <E*b|£'b> también, resultando una nueva contradicción. Así pues, 
todos los términos de (31) son nulos, y la descomposición de un ket [P> en la 
- forma indicada por el segundo miembro de (25) es única. 


11. Funciones de observables 


Sea £ un observable. Podemos multiplicarlo por cualquier número real k 
y obtener otro nuevo observable kE. Para que nuestra teoría sea coherente 
es necesario que cuando el sistema se halle en un estado en el que con 
toda certeza obtenemos el resultado E” al medir el observable E, el resul- 
tado de medir el observable kg sea con toda certeza kE”. Es fácil comprobar 
que se satisface dicha condición. El ket que corresponde a un estado en 
el que con toda certeza al medir £ obtenemos el resultado E” es un autoket 
de £ al que llamaremos |8”>, que verifica 


518 =E 8. 
De esta ecuación resulta también, YA 
KEl8"> =X8E0, 


que nos indica que |¿'> es un autoket de ké perteneciente al autovalor kg”, 
y que, por lo tanto, al medir k£ obtendremos con toda seguridad el resul- 
tado k8?. 

Más en general, podemos tomar cualquier función real de E, por ejem- 
plo f(8), y considerarla como un nuevo observable que queda medido auto- 
- máticamente cuando se mide E, pues una medida experimental de £ también 
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E “nos permite disponer del valor de f(£). No es necesario que f(£) sea real, y 


cuando no lo es tanto su parte real como su parte imaginaria son observables 
que quedan determinados automáticamente cuando medimos E. Para que la 
teoría sea coherente, es necesario que 'al medir la parte real y la parte 
imaginaria de f(£) en un estado en el que una medida de E dé con certeza 
el resultado E”, obtengamos con toda seguridad las partes real e imagi- 
naría de f(£”). Si f(£) es desarrollable en serie de potencias . 


f(E) =00 +05 +24 088+.... 


siendo los c; ciertos números, la condición dada se puede comprobar con los 
- métodos del álgebra elemental. Para funciones f más generales no será 

posible comprobarla. En este caso puede utilizarse dicha condición para 
definir f(£), que aún no habíamos definido desde el punto de vista matemá- 
tico. De este modo podemos dar una definición de función de un observable 


más general que la que se obtiene mediante series de potencias. 


Definiremos f(E) como el operador lineal que rá 
RENE) =HENE> 
a DS ó 


para todo autoket |£”> de E, siendo f(£”) una función numérica de £”. Puede 
verse fácilmente que la definición dada está justiicada cuando sé aplica 
a autokets |£”> que no sean todos independientes, pues si tenemos un autoket 
¡E'A> que dependa de otros autokets de £, todos ellos tienen que pertenecer 
al mismo autovalor E”, ya que de no ser así llegaríamos a una ecuación 
análoga a la (31) que según hemos visto es imposible. Y así, multiplicando 
la ecuación que expresa |E”A> como combinación lineal de los otros auto- 
kets de E por f(E) a la izquierda, no hacemos más que multiplicar cada 
término por el mismo número f(8”), obteniéndose con ello una ecuación 
coherente. Además, la ecuación (34) es suficiente para definir completa- 
mente el operador lineal f(£), pues para obtener el resultado de aplicar f(5) 
a un ket |P> arbitrario basta desarrollar |P> en la forma indicada por el 


- segundo miembro de (25), y tomar 


(34) 


Hz = Í 180 o> dE + SAEN O. (35) 


El complejo conjugado 1(E) de f(£) queda definido por la ecuación ima- 
ginaria conjugada de la (34), o sea | | | 


<ENE) = ENE, 


para todo autobra <E”, siendo F(5') la función compleja conjugada de f(%”). 
- Si sustituimos E” por E” en esta ecuación, y la multiplicamos a la derecha 
por el ket arbitrario |P>, con ayuda del desarrollo (25) y del teorema de 
ortogonalidad, resulta | | 
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<ETEN?> = H(E")ENP> 
=| EXE O de + EHENENEA (36) 


=]| HEM<E"EC> dE' E ENEE" 


en donde <E”|£”d> es igual a cero si E” no es ninguno de los autovalores 
que figuran en la suma (25). Poniendo ahora en (35) en lugar de f(57 la 
función compleja conjugada F(£') y multiplicando a la izquierda por <E”], 
resulta . 


ERE = | NEXENO del + KENCEEA. 


El segundo miembro de esta ecuación es igual que el de (38), pues los inte- 
grandos son nulos para todo E” + E”, y por tanto, 


a) 


<EURE|P> =<E"HE)P>. 
Esta ecuación es válida para todo autobra <£”| y para todo ket |P> de 


modo que 
| HE) = 18), (87) 


Por tanto, el complejo conjugado del operador lineal f(8) es igual a la 
función $ de E, compleja conjugada de f. i | 
Como corolario resulta que si f(£') es una función real de E”, f(8) es un 
_ Operador lineal real. Por tanto, f(£) también es un observable, ya que ade- 
- más todo autoestado de E también es autoestado de f(5) y, en consecuencia, 
sus autoestados constituyen un conjunto completo. A 
Con la definición dada, estamos en condiciones de asignar significado 
a cualquier función f de un observable, cuya función de variable real Ra) 
correspondiente tenga un dominio de existencia que abarque todos los 
autovalores del observable. Si el dominio de existencia de dicha función 
contiene otros puntos que no correspondan a autovalores, los valores de f(x) 
en ellos no afectan para nada a la función del observable. La función no 
tiene por qué ser ni analítica ni continua. Los autovalores de la función f 
de un observable son iguales a la función f de los autovalores de dicho 
observable. 

Es importante tener en cuenta que para poder definir la función f de un 
observable es necesario que para cada x que sea autovalor del observable 
exista un único valor de f(x). Es decir, la función f(x) debe ser uniforme. 
Podemos poner de manifiesto este hecho haciendo la siguiente considera- 
ción: cuando tenemos un observable f(A) que es función real del obser- 
vable A, ¿es a su vez A función del observable f(A)? La respuesta es que sí 
cuando a cada autovalor A” de A le corresponda un valor distinto de f(A”); 
pero si existen dos autovalores de A, por ejemplo A” y A”, para los que se 
tenga f(4”) =f(4”), entonces no existiría un único autovalor de Á que 
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- correspondiera al autovalor f(A”) del observable f(A) y, por lo tanto, A no 


sería función del observable f(A). | 


Es fácil comprobar desde el punto de vista matemático, y a partir de la 
- definición, que la suma o el producto de dos funciones de un observable 
es otra función del mismo, y que una función de una función de un obser- 
vable también es función de dicho observable. Asimismo es inmediato 
comprobar que toda la teoría de funciones de un observable es simétrica 
respecto a bras y kets, y que hubiéramos podido proceder del mismo modo 


con la ecuación 
EE) = F(E0E" | (38) 

en lugar de la (34). | | 

Terminaremos esta sección examinando dos ejemplos de gran interés 
práctico: la función recíproca y la raíz cuadrada, El recíproco de un obser- 
vable existe siempre que el observable no tenga el autovalor cero. Si el 
observable « no tiene el autovalor cero, su recíproco, que lo representa- 
' remos por «7? o 1/a verificará S 


ala» = + a>, | (39) 
donde |a”> es un autoket de « que pertenece al autovalor a”. Por tanto, 
O. 
Puesto que esta relación es válida para todo autoket |a”>, debe verificarse 


at 1, (40) 
Y análogamente, 
ae =L (41) 


Cualquiera'de estas dos ecuaciones es suficiente para definir completa- 
mente a”, siempre que a no tenga el autovalor cero. En efecto, en el caso 
de la ecuación (40), sea x un operador lineal cualquiera que verifique la 
ecuación | 

ax = 1. 


Multipliquemos ambos miembros a la izquierda por el operador a”? defi- 
nido en (39). El resultado es 


| alarma? 
y según (41) 
7 =0 

Las ecuaciones (40) y (41) se pueden utilizar para definir el recíproco 
(si es que existe) de un operador lineal « más general que no tiene por qué 
ser real. En este caso, puede que no sea suficiente una sola de las ecuaciones. 
Si dos operadores lineales « y 8 tienen recíprocos, su producto a y 8 tiene 
por recíproco | E | | 


(48) = Bor, | (42) 


(a pt _ ea 


e A A 
me 
AS 
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que se obtiene tomando el recíproco de cada factor e invirtiendo el orden. . 
-- Podemos comprobar (42) sin más que multiplicar el segundo miembro por a8 
- a la derecha o a la iquierda y ver que se obtiene la identidad. Esta regla 


para obtener el recíproco de un producto puede generalizarse inmediata- 
mente para más de dos factores, y así 


(aBr... ==... y Bra i, 


La raíz cuadrada de un observable a existe siempre, y cuando a no 
tiene autovalores negativos, es real. La representaremos por ya o por al, 
Verifica la relación j 


- 


Vaj) == ya) (43) 
para todo autoket |a”> de a perteneciente a un autovalor a. Por tanto, 
VaVala) = Y2 yea) = 4) = ala"), 
y como esto es válido para todo autóket |a”>, resulta 


Vaya=0u (44) 


Dada la ambigiiedad de signo en (43), existirán muchas determinaciones 
posibles de la raíz cuadrada. Para fijar una de ellas tenemos que especificar 
_ el signo que corresponde a cada autovalor. Dicho signo puede cambiar 
- irregularmente de un autovalor a otro, pues en cualquier caso (43) define 
un operador lineal y « que verifica (44) y que constituye, por tanto, una raíz 
cuadrada de a. Si existe algún autovalor de a al que le pertenezcan dos o 
más autokets independientes, entonces según la definición de función de un 
observable, hemos de atribuir el mismo signo a todos ellos en (43). Sin em- 
bargo, si tomásemos distintos signos, la ecuación (44) continuaría siendo 
- válida y por tanto, salvo en el caso particular de que a cada autovalor de « 
- le corresponda un único autoket de a independiente, la ecuación (44) por sí 
sola no es suficiente para definir ya. | 

El número total de determinaciones posibles de la raíz cuadrada de un 
- —— Observable es 2", siendo n el número total de autovalores no nulos. En la 
o g práctica únicamente se utiliza la función raíz cuadrada para observables 
| que no tienen autovalores negativos, y la determinación de la raíz que tiene 
utilidad es la que se obtiene tomando siempre el signo positivo en (43). 

Tal determinación se denomina la raíz cuadrada positiva. 


| 12. Interpretación física general 
Las hipótesis introducidas al principio de $ 10 nos dan una interpre- 


tación física de la teoría matemática que sólo se puede aplicar en casos 
particulares, pues únicamente sirve para autoestados. Necesitamos alguna 
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hipótesis más general que también nos permita obtener información física a 
partir de la teoría matemática cuando no consideremos autoestados. 

- En mecánica clásica decimos que un observable “tiene un valor” para 
cualquier estado del sistema. ¿Qué es lo que corresponde a esto en mecá- 
nica cuántica? Si consideramos un observable £ y dos estados x e y corres- 
pondientes a los dos vectores <x| e |y>, podemos formar el número <x]Ely>. 
Dicho número no tiene características análogas al valor que “tiene” un obser- 
vable en la teoría clásica por tres razones principales: (1) hace referencia 
a dos estados, mientras que el valor clásico siempre se refiere a uno, (1) en 
general no es un ní real, y (mi) no está. unívocamente determinado 
por el observable y los estados, pues los vectores <a] e |y> contienen facto- 
res numéricos arbitrarios. Incluso si imponemos la condición de que <x| e |y> 
estén normalizados, <x|Ely> continuará estando indeterminado en un factor 
de módulo uno. Sin embargo, si tomamos dos estados idénticos y elegimos 
ly> de modo que sea el vector imaginario conjugado de <x|, ninguna de las 
' tres razones apuntadas tiene validez. El número que obtenemos en este 
caso <xlElx> es necesariamente real y está unívocamente determinado si 
<a] está normalizado, pues si multiplicamos <x| por el factor numérico e*, 
siendo c un número real, tenemos que multiplicar |x> por e”*, y <x|Elx> 
toma el mismo valor de antes. 

Por tanto, podríamos hacer la sugestiva hipótesis de que cuando el 
sistema está en el estado x, el observable E “tiene un valor” <x|5lx> en un 
sentido análogo al clásico. Sin embargo, esta hipótesis no sería satisfactoria 
por la siguiente razón. Consideremos un segundo observable y que según 
la hipótesis anterior tendría un valor <x|njx> cuando el sistema está en el 
mismo estado de antes. Por la analogía clásica, para este estado la suma de 
los dos observables debería tener un valor igual a la suma de los valores 
de los dos observables por separado, y el producto un valor igual al produc- 
to de dichos valores. La hipótesis nos llevaría al valor <x[E + mix> para la 
suma de los dos observables, que coincide con la suma de <x]élx> y <x[nlx>, 
pero para el producto nos conduciría al valor <x|Enix> o bien al <x[nálx>, y 
ninguno de ellos está relacionado de forma simple con <x|Elx> y <x|nix>. 

Pero como la hipótesis sólo falla para el producto, sería lógico decir que 


rataados, ya qu también se llama valor esperado) del obser- 
vable o x, ya que el promedio de la suma de dos cantidades 
tiene que ser igual a la suma de promedios de dichas cantidades, pero el 
promedio del producto no tiene por qué ser igual al producto de promedios. 
Por tanto, hacemos la hipótesis general de que si medimos el observable E un 
gran número de veces cuando el sistema está en el estado que corresponde 
a |lx>, el valor medio de todos los resultados obtenidos será <x|Elx> st |x> 
está normalizado. Si lx> no está normalizado, como ocurrirá necesariamente 
en el caso de que el estado x sea un autoestado de cierto observable perte- 
neciente a un autovalor que forma parte de un dominio de autovalores de 
medida no nula, la hipótesis se convierte en que el valor medio de las medi- 
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das de É£ es proporcional a <x]£lx>. Esta hipótesis general nos da la base 

. para la interpretación física general de la teoría. . 

Unicamente podemos decir en mecánica cuántica que un observable 
“tiene un valor particular en un estado determinado, cuando estemos total- 
_ mente seguros de que el resultado de medirlo es siempre dicho valor par- 
ticular, o sea, cuando el sistema esté en un autoestado del observable. Si 
convenimos en utilizar la expresión de que un observable “tiene un valor” 
con este significado restringido, es fácil comprobar con la ayuda del álgebra 
introducida, que si dos observables tienen un valor para un estado particular, 
entonces para dicho estado la suma de los dos observables (si es que es un 
observable *) tiene un valor igual a la suma de los valores de los dos obser- 
_ vables, y el producto de ellos (si es que es un observable **) tiene un 
valor igual al producto de los valores de los dos observables, 

En el caso general no tiene sentido hablar del valor que tiene un obser- 
vable para un estado particular del sistema, pero sí podemos hablar del 
- valor medio de dicho observable en .ese estado. Podemos incluso ir más allá 
y hablar de la probabilidad de que al medirlo obtengamos dicho valor. 
Esta probabilidad puede obtenerse según la hipótesis general del siguien- 
te modo. 

Sea el observable £ y consideremos el estado correspondiente al ket 
normalizado |x>. La hipótesis general no sólo nos da el valor medio de E, 
que es <x]élx>, sino también el valor medio de cualquier función de E tal 
como f(4), que será <xIf(£)lx>. Tomemos como f(E) una función de E que 
valga 1 cuando E = a, siendo a cualquier número real, y cero en cualquier 
otro caso. De acuerdo con nuestra teoría general de funciones de un obser- 
vable, dicha función de E tiene sentido, y podemos designarla 3,, en con- 
formidad con la notación general del símbolo 3 con dos subíndices dada en 
la pág. 73 (ecuación 17)). El valor medio de dicha función de E es preci- 
samente la probabilidad P, de que E tenga el valor a. O sea 


Pa = <xB sala. (45) 


Si a no es autovalor de 8, 3,, multiplicado por cualquier autoket de E es 
cero y, por tanto, 3¿a = 0 y P,¿—= 0, Esto está de acuerdo 'con la conclusión 
de $ 10, de que todo resultado de la medida de un observable tiene que ser 
uno de sus autovalores. | 

- Silos posibles resultados de medir E constituyen un conjunto de números 
de medida no nula, la probabilidad de que E tenga exactamente un deter- 
minado valor será nula para muchos problemas físicos. La magnitud que 


* La suma de los dos observables no tiene por qué ser un observable, pues pudiera 


no tener suficientes autoestados para constituir'un conjunto completo, en cuyo caso el 
operador suma considerado siste damente no sería medible. . 

** Para el producto, la condición de que sea un observable puede no verificarse 
, tanto porque sus autoestados no constituyan un conjunto completo, como por no ser real. 
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tiene importancia física en este caso es la probabilidad de que É tenga un 
valor perteneciente a un pequeño intervalo entre a y a + da. Esta proba- 
bilidad, que podemos simbolizar por P(a)da, es igual al valor esperado de la 
función de E que vale uno para valores de £ comprendidos enrte a y a + da 
y cero fuera de dicho intervalo. Según la teoría de funciones de un obser- 
vable, esta función de E tiene sentido. Designándola por x($), tenemos 


P(a) da = <xiy(E)ix>. (46) 


Si el intervalo (a, a + da) no contiene ningún autovalor de E, resulta como 
en el caso anterior, x(E) =0 y P(a) =0. Si |x> ng está normalizado, los 
segundos miembros de (45) y (46) serán respectivamente proporcionales a las 
probabilidades de que £ tenga un valor a y de que É tenga un valor com- 
prendido entre a y a + da. 

La hipótesis de $ 10 de que cuando el sistema está en un autoestado 
de E perteneciente al autovalor E” toda medida de E da con seguridad el 
_ . resultado E”, está de acuerdo con la hipótesis general relativa a la interpre- 
tación física, y de hecho es consecuencia de ella. Según la hipótesis general, 
si |E”> es un autoket de E perteneciente al autovalor £”, entonces en el caso 
de que los autovalores de £ constituyan un conjunto discreto, resulta 


Bla E'>=0 salvo para a=f8, 


y en el caso de que los autovalores de E constituyan un dominio de medida 


no nula i 
y(8NJ£'> =0 salvo si el intervalo (a, a + da) incluye a £”. 


En ambos casos, la probabilidad de que € tenga un valor distinto de E” cuan- 
do el sistema está en el estado correspondiente a |E”> es cero. 

En la práctica es imposible obtener un sistema estrictamente en un 
autoestado de E perteneciente a un autovalor £' que forme parte de un in- 
tervalo de autovalores, ya que para ello sería necesaria una precisión 
absoluta. Lo máximo que se puede conseguir en la práctica es que £ tenga 
un valor perteneciente a un pequeño intervalo alrededor del valor £. El sis- 
“tema estará entonces en un estado parecido a un autoestado de E. Así pues 
un autoestado perteneciente a un autovalor que forme parte de un intervalo 
de autovalores es una idealización matemática, y no se puede realizar en la 
práctica, A pesar de ello dichos autoestados tienen un papel muy impor- 
tante en la teoría, y sin ellos no podríamos hacer gran cosa. La ciencia con- 
tiene muchos ejemplos de conceptos teóricos que son límites de cosas que se 
dan en la práctica, y que son de gran utilidad para la formulación precisa 
de-las loyes-de la. naturaleza, pese a que nó sé pueden levar a cabo expe- 
rimentalmente; y éste no es más que uno de ellos. Es posible que el que la 
longitud de los kets correspondientes a estos estados sea infinita esté rela- 
cionado con su irrealizabilidad práctica, y que todos los estados realizables 
corresponden a kets que puedan ser normalizados y que, en consecuencia, 
forman parte de un espacio de Hilbert, 
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13. Conmutabilidad y compatibilidad 


Un estado puede ser autoestado de dos observables a la vez. Suponga- 


, MOS que para los observables E y y exista un estado como éste correspon- 
- diente al ket [A>. Entonces podremos escribir las ecuaciones 


El4> = EA), 
nlA> = 1/14), 
donde E” y y son los autovalores respectivos de E y n. De aquí se deduce 


EnlA> = En ]A> = EWIA> = EnJA> = 184) =n6]4>, 


(En — AE)NA> =0. 


O sea 


- Éste resultado sugiere que la posibilidad de que existan autoestados comu- 


nes se verá favorecida cuando £n—nE = 0,. es decir, cuando los dos obser- 
vables conmuten. Si no conmutan, no es que no exista dicha posibilidad, pero 
es más bien excepcional. En cambio, si_conmutan vamos a ver que existen 


A que son a la vez autokets de uno Y gtro, para formar un 
C 


o | 
Sean E y 1 dos observables que conmutan. Tomemos un autoket |n> 


de 7, que pertenezca al autovalor y y expresémoslo en función de auto- 
- kets de E en la forma que indica el segundo miembro de (25) 


>=) lento de + Ela. (47) 


Los autokets de £ que figuran en el segundo miembro tienen el símbolo 
extra y' para indicar que provienen del desarrollo del ket |n> y no de un 
ket cualquiera como ocurría en la ecuación (25). Veamos que cada uno 


“de estos autokets de £ es también autoket de y perteneciente al auto- 
valor y. Se tiene 


O= (ib) =$ (000) (810) de" + E (n—lEmd>. (48) 


Pero el ket (n—118"y'd> verifica 


ENn—015"d> =(9—n) ElErnd> = (9 — 1 )E EY d> 
| = E —0 18" d>, 


- lo que demuestra que es un autoket de E que pertenece al autovalor E”; 


análogamente, el ket (n—n)15'yc> también es autoket de E y pertenece 
al autovalor £'. La ecuación (48) está constituida por una integral más 
una suma de autokets de E igualada a cero. En virtud del argumento utili- 









13. CONMUTABILIDAD Y COMPATIBILIDAD al 


zado para la ecuación (31), ello es imposible a menos que el integrando y 
- cada uno de los términos de la suma sean nulos. Luego | ; 


(18707 =0, — (—aMErVd) =0, 


lo que nos dice que todos los kets que aparecen en el segundo miembro 
de (47) son autokets tanto de E como de 1. La ecuación (47) expresa |n> en 
función de autokets comunes a E y m; y puesto que todo ket puede expre- 
sarse en función de autokets |n'> de n, resulta que todo ket puede expresarse 
en función de autokets comunes a E y a n y, en consecuencia, dichos kets 
constituyen un conjunto completo. 

Los anteriores autokets |E”n'c> y |E"y'd> comunes a £ y a y los hemos 
, caracterizado por los autovalores £' y Y, o bien £" y y a los que pertenecen, 
- junto con las letras c o d que también son necesarias. Igual como hacíamos 
hasta ahora con los autovectores de un único observable, de aquí en adelante 
siempre emplearemos los autovalores para designar a los autovectores 
comunes a varios observables como regla general. 

El recíproco del teorema precedente dice que si E y y son dos observa- 
bles tales que los autoestados comunes a ambos constituyen un conjunto 
completo, entonces E y y conmutan. Para demostrarlo tengamos en cuenta 
que si |E'n'> es un autoket común a ambos perteneciente a los autovalores 
E! y y, se tiene 


(En—08)5'1> = (EY —15)18'n> =0. (49) 


Pero como los autoestados comunes a ambos constituyen un conjunto com- 
pleto, todo ket |P> puede ser expresado en función de autokets |E”7'> comu- 
nes a É£ y ay, para cada uno de los cuales se verifica (49), luego 


(En—n8)1P> =0 
de modo que 


En—nká =0. 


La cualidad de los estados de ser autoestados comunes puede ser válida 
para más de dos observables, en cuyo caso tanto el primer teorema como su 
recíproco siguen siendo válidos, es decir, si cualquier conjunto de observa- 
les conmutan dos 3 Cos, los autoestados comunes a todos ellos constituyen 
un conjunto completo y secfprocamente- Los argumentos empleados para 

emostrar los teoremas en el caso de dos observables pueden aplicarse a su 
vez para demostrar el caso general; por ejemplo, si tenemos tres observables 
que conmutan E, y y €, podemos expresar cualquier autoket común a É£ y n 
en función de autokets de Y y ver que cada uno de esos. autokets de Y es a 
su vez autoket de E y de y. Con ello todo autoket común a É y a y queda 
expresado en función de autokets comunes a E, y y Y, y puesto que todo ket 
puede expresarse en función de autokets comunes a E y y, resulta que todo 
ket se puede expresar en función de autokets comunes a E, y y Y. 
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- El teorema de ortogonalidad aplicado a este caso nos dice que cualquier 
- par de autokets comunes a un conjunto de observables que conmutan, y que 
pertenezcan respectivamente a dos conjuntos de autovalores que difieran en 
algún elemento, son ortogonales. 

Considerando el conjunto completo de los autoestados comunes a dos o 
más observables que conmutan, podemos elaborar una teoría de las fun- 
ciones de ellos igual que hicimos en $ 11 para las funciones de un único 
observable. Si E, y, Y, ..., son observables que conmutan, definimos una 
función general de ellos f como el operador f(E, $», Y, ...) que verifica 


Eno MER ES EEN, (50) 


para todo autoket |E'n'£”...> común a E, y, €, ..., y cuyos autovalores son 
E”, 11, Y, ... En esta definición f es cualquier función con tal de que f(a, b, 
C, ...) esté definida para todos los valores de a, b, c, ... que sean autovalores 
de E, 1, €, ..., respectivamente. Del mismo modo que hicimos con las fun- 
ciones de un único observable, definidas por (34), podemos demostrar que 
KE, m5 ...) está univocamente determinado por (50) y que . 


f(8, e A —Á FE, Y 6, e 


en correspondencia con (37). Asimismo, si fía, b, c, ...) es una función 
real, f(€, vn, €,...) es real y observable. 
Podemos generalizar ahora los resultados (45) y (46). Dado un conjunto 
de observables E, y, Y ..., que conmutan, podemos definir una función de 
ellos que sea igual a 1 paraE=a, 9 =b,%=cC,..., cona, b, c, ..., núme- 
ros reales cualesquiera, e igual a cero cuando no se verifique dicha condición. 
Esta función puede representarse por 8,a, 3,o, 3,0, ..., ya que en realidad 
es igual al producto en cualquier orden de los factores Ba, Ind, 870) ..., lefi- 
nidos cada uno de ellos como funciones de un solo observable, como puede 
- comprobarse sustituyendo dicho producto en lugar de f(E, m, €, ...) en el 
_ primer miembro de (50). El valor esperado de dicha función en cualquier 
estado será igual a la probabilidad P,».... de que E, 7, Y, ..., tengan respec- 
tivamente los valores a, b, c, ..., cuando el sistema esté en dicho estado. 
- Por tanto, si dicho estado corresponde al ket normalizado |x>, a partir de 
nuestra hipótesis general sobre la interpretación física, resulta 


Pb. == <xl8B 108, 0870...[x>. (51) 


Pazo... será nula a menos que cada uno de los números a, b, c, ..., sea auto- 
valor del correspondiente observable. Si cada uno de los números a, b, c, ..., 
es un autovalor del correspondiente observable perteneciente a un dominio 
de autovalores de medida no nula, por regla general también será nula la 
probabilidad Pa»...., pero en este caso podemos sustituir la exigencia de que 
el observable tenga exactamente un valor por la condición de que tenga 
un valor comprendido en un pequeño intervalo, lo que se consigue sustitu- 
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yendo los factores 3 de (51) por un factor correspondiente a x(%) de la 
ecuación (46). Llevando a cabo esta sustitución para cada uno de los obser- 
vables E, 1, €, ..., cuyos valores numéricos correspondientes 4, b, €, ... 
formaban parte de un dominio de autovalores de medida no nula, obten- 
dremos una probabilidad que en general ya no es nula. 

Si varios observables conmutan, existen estados para los que todos los 
observables tienen valores particulares en el gentido indicado (al principio . 
de la pág. 58), que son los autoestados comunes. Por tanto, tiene sentido 
hablar de que varios observables que conmutan tienen un valor simultánea- 
mente. Aún más, vemos por (51) que para cualquier estado tiene sentido 
hablar de la probabilidad de obtener resultados particulares al medir 
simultáneamente distintos observables que conmutan. Esta nueva conse- 
cuencia es importante. En general no es posible llevar a cabo una observa- 
ción de un sistema que esté en un estado definido sin alterar dicho estado 
y trastornarlo a fines de llevar a cabo una segunda observación. En el caso 
general, no tiene sentido hablar de que realizamos las dos mediciones 
simultáneamente. Sin embargo, la consecuencia anterior nos dice que, en 
el caso particular de que los dos observables conmuten, puede conside- 
rarse que las dos observaciones no interfieren entre sí, o que son compa- 
tibles en el sentido de que podemos considerar que las dos medidas se 
realizan simultáneamente, y hablar de la probabilidad de obtener resulta- 
- dos particulares cualesquiera en ellas. De hecho las dos observaciones 
pueden considerarse como una sola observación más complicada cuyo 
resultado viene dado por dos números en lugar de por uno. Desde el punto 
de vista de la teoría general, cualquier par o más de observables que 
conmutan puede ser considerado como un único observable cuyo resultado 
de medida viene dado por dos o más números. Los estados para los cuales 
dicha medición da con certeza un resultado particular son los autoestados 
comunes. 
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14. Vectores básicos 


En los capítulos anteriores hemos establecido un esquema algebraico 
con tres tipos de cantidades — los vectores bra, los vectores ket y los opera- 
dores lineales — y mediante dicho esquema hemos expresado algunas leyes 
fundamentales de la naturaleza. Se podría seguir desarrollando la teoría y 


aplicarla a problemas particulares considerando únicamente dichas canti- 


dades abstractas. Sin embargo, para ciertos fines es preferible sustituir dichas 
cantidades por conjuntos de números con propiedades matemáticas análo- 


- gas y hacer los desarrollos con ayuda de ellos. El procedimiento es similar 


al de elegir coordenadas en geometría, y tiene la ventaja de ser un método 
matemático más potente para resolver problemas particulares. 

El procedimiento de sustituir las cantidades abstractas por números no 
es único. Igual que existen muchos sistemas de coordenadas en geometría, 


también hay muchas maneras de sustituir nuestras cantidades abstractas - 


por números. Á cada uno de estos procedimientos se le denomina representa- 
ción y al conjunto de números que sustituyen a una cantidad abstracta le 


“denominaremos el representante de dicha cantidad en la representación. 


Así pues el representante de una cantidad abstracta corresponde a las coor- 
denadas de un objeto geométrico. Cuando estudiamos un problema par- 
ticular en mecánica cuántica, podemos ahorrarnos trabajo empleando una 
representación en la que los representantes de las cantidades abstractas 


, más importantes que intervienen en el problema sean lo más sencillas 


posible. y 


Para fijar una representación en el caso general, consideremos un con- 


junto completo de bras, o sea, un conjunto de bras tal que todo bra se 


pueda expresar linealmente en función de los bras del conjunto (bien como 


una suma de bras, bien como una integral, o como una integral más una 
suma). A estos bras les denominaremos bras básicos de la representación, 
y como veremos, serán suficientes para determinar completamente la re- 
presentación. | 

Sea un ket [a> cualquiera y formemos los productos escalares con cada 
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=3o de los bras básicos. Los números así obtenidos constituyen el represen- 
Tánte de Ja), y veamos que son suficientes para determinar completamente 
el ket ja». En efecto, si existiera otro ket |a,> para el que dichos números 
fueran iguales, el producto escalar de la diferencia la>—la,> con cualquier 
bra básico sería nulo y, por tanto, también sería nulo el producto escalar con 
cualquier bra. Luego, la>—a,> sería nulo también. | 

- Supongamos que los bras básicos están simbolizados por uno o más pará- 
metros As, Ao, ..., Au, cada uno de los cuales puede tomar ciertos valores 
- numéricos. Dicho bra básico lo escribiremos entonces <A122...Au| y el repre- 

sentante de |a> lo escribiremos <A122...Au]a>. Así pues, el representante está 

constituido por un conjunto de números en correspondencia con cada 

conjunto de valores de Ai, 22, ..., Aw que forme parte de los respecti- 

vos campos de variabilidad. Un conjunto de números tal, constituye una - 
función de las variables 21, Az, ..., Au Por tanto, el representante de un. 


ket puede considerarse bien como un conjunto de números_o bien como 
: na función de las variahles que se emplean para especificar los bras básicos. 
Si el número de estados independientes de nuestro sistema dinámico es 
finito e igual a n, será suficiente considerar n bras básicos que podremos 
designar con ayuda de un solo parámetro A que tome los valores 1, 2, 3, ..., . 
En este caso, el representante de un ket |a> cualquiera está constituido por 
los n números <lja>, <2la», <3]a>, ..., <nla>, que son precisamente las coor- 
_denadas del vector |a> referidas a un sistema de coordenadas ordinarias. 
Por tanto, el concepto de representante de un ket es una generalización del 
| gueto de coordenadas de un vector ordinario, y cuando el número de 

imensiones del espacio delos kets es fimito, ambos coinciden. 

En una representación general no es necesario que todos los bras básicos 
sean independientes. Pero en la mayoría de las representaciones que se 
utilizan en la práctica son independientes y además verifican la condición 
más severa de ser ortogonales dos a dos. En este caso se dice que la repre- 
sentación es una representación ortogonal. O 
Sea una representación ortogonal cuyos bras básicos <A12z...Au| estén sim- 
bolizados por los parámetros A1, Az, ..., Au, QUe sólo pueden tomar valores 
reales. Dado un ket la», podemos tomar su representante <A1%2...Au[4>, y 
considerar los números 11<2:122...Ayl2>, formados a partir de los anteriores, 
como el representante de un nuevo ket |b>. La posibilidad de esta elección 
se deriva de que los números que forman el representante de un ket son 
- independientes, dado que los bras básicos también lo son. Con ello el ket |b> 
queda definido por la ecuación 


<A Az. , «Aylb> e A<ArAo. a ¿Ay la> , 


- Dicho ket |b> evidentemente es función lineal del ket |a> y, por lo tanto, 
- puede ser considerado como el resultado de aplicar un operador lineal a la>. 
- Si lamamos L, a dicho operador, resulta , 


Ib> = L, |a> 


F 
6 : 
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y en consecuencia <AjAkz...AyLija> = A<AjAz...Ay[a>. 
Esta ecuación es válida para todo ket ja>, luego 
<A1A2...Ay[La = A <A1Az» » «Aul (1) 


La ecuación (1) puede tomarse como la definición del operador lineal L,. 
En ella vemos que todo bra básico es un autobra de L, y el autovalor a que 
pertenece es el valor del parámetro 2. 

De la condición de que los bras básicos sean ortogonales se deduce 
que £, es real y que es un observable. En efecto sean A, M,, ..., A, y 
Ar Az» +.» A, dos conjuntos de valores de los parámetros 21, Az, ..., Aus 
Poniendo los A en lugar de los A, en la ecuación (1) y multiplicando a la 
derecha por el conjugado imaginario del bra básico <A72%...A/|, o sea por 
TAS ...A >, resulta 


<A - +A, [E JAZZ... =A< Ago 0 ALIAGA z»..A7>. 
Permutando los A” y los A obtendremos 


SUE A A RAES LANA COS 





Dado que los bras básicos son ortogonales, los segundos miembros de estas 
dos ecuaciones se anulan excepto si 1” = 2” para todo r desde 1 hasta u, en 


- Cuyo caso son iguales y además reales por serlo A: Luego, tanto si los No y 


los 1, son iguales como si no lo son, se tiene 


AAA TA 
= <M Ayo. MIE (AZ... M2) 


según la ecuación (4) de $ 8. Puesto que los <A/A/...A“] constituyen un 
conjunto completo de bras y los |A/1%...A”> un conjunto completo de kets, 
resulta que L, = L,. La otra condición requerida para que L, sea un obser- 
vable, la de que sus autoestados constituyan un conjunto completo, eviden- 
temente también se satisface, pues sus autobras son los bras básicos, que 
constituyen un conjunto completo. 

- Asimismo podríamos introducir otros operadores lineales Lz, Lg, ... Ly, 
multiplicando <A1A2...Aula> por los factores la, A3, ... Ay respectivamente 
y considerando los conjuntos de números que así resultan como los repre- 
sentantes de nuevos kets. Análogamente podemos ver que los bras básicos 
son autobras de cada uno de los L,, y dichos operadores son reales y obser- 
vables. Los bras básicos son autobras comunes a todos los L,, y dado que 
constituyen un conjunto completo, resulta, según el teorema de $ 13, 
que los L, conmutan dos a dos. 

Vamos a demostrar ahora que sí E, Ez, ..., E, es un cónjunto cualquiera 
de observables que conmutan, podemos formar con ellos una representación 
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ortogonal en la que los bras básicos son aútobras comunes a los Es, Es, ... Eu 
Supongamos primero que no exista más que un solo autobra indepen- 
diente común a Es, Ez, ..., Eu que pertenezca al conjunto de autovalores 
49 % E/. En este caso tomaríamos como bras básicos los autobras comu- 
nes con factores numéricos arbitrarios. En virtud del teorema de ortogo- 
nalidad todos ellos serán ortogonales (cualquier par de ellos tendrá al 
menos algún autovalor distinto, y ello es suficiente para que sean ortogo- 
nales), y según el resultado de $ 13 habrá suficientes para constituir un 
conjunto completo. Podemos designarlos adecuadamente mediante los auto- 
valores Ef, El, ..., é/, a que pertenecen, y así escribiremos uno de ellos 
SATA 
En el caso general en que para algunos conjuntos de autovalores existan 
varios autobras independientes comunes a Ej, Es, ..., Eu, de todos los auto- 
bras comunes pertenecientes a los autovalores 5, E, e caos 5, tenemos que 
- elegir solamente un subconjunto completo, de modo que cada bra sea orto- 
- gonal a los otros. (En este caso, la condición de completitud quiere decir 
que cualquier autobra común perteneciente a los autovalores E, AA 


se pueda expresar linealmente en función de los elementos del sub- 
conjunto.) Esto hemos de hacerlo para cada conjunto de autovalores 
57 Es» dea 5, y después reunir todos los elementos de cada subconjunto 
así obtenidos, y considerarlos como los bras básicos de la representación. 
Todos estos bras son ortogonales, pues si pertenecen a autovalores distintos 
son ortogonales en virtud del teorema de ortogonalidad, y los que per- 
tenecen a un mismo conjunto de autovalores lo son por el modo como 
los hemos definido; además constituyen un conjunto completo de bras, ya 
que todo bra se puede expresar linealmente en función de autobras comunes 
y cada autobra común se puede expresar a su vez linealmente en función 
de los bras del subconjunto. Existen infinitas maneras de elegir dichos 
subconjuntos, y cada una de ellas constituye una representación ortogonal, 
En este caso general para designar un bra básico, además de los auto- 
valores E» En 0. E, 8 los que pertenece hemos de añadir ciertas variables 


reales As, Az, ..., Ap para distinguir los vectores básicos que pertenecen al 
mismo conjunto de autovalores. Los bras básicos serán pues <8, an 
E, A1k2»..Avl. Podemos ahora definir unes operadores lineales Li, La, ..., Lo 
relativos a las variables 21, Ax, ..., Ay mediante ecuaciones análogas a la (D, 
y ver que los bras básicos son autobras de ellos, y que dichos operadores 
son reales y observables, que además conmutan dos a dos y con los ¿4. 
Así resulta que los bras básicos son autobras comunes a todos los obser- 
vables Es, Es, ..., Eu, Li, La, ..., Lo que conmutan dos a dos. 

Definimos un conjunto completo de observables que conmutan como un 
conjunto de observables que conmutan dos a dos, para el que no existe más 
que un único autoestado común perteneciente a un conjunto cualquiera 
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de autovalores. Con esta definición los observables Es, Es, ..., En, L,, La, ..., 
L, constituyen un conjunto completo de observables, ya que no existe 
más que un solo autobra independiente perteneciente a los autovalores 

6 La ==» E) Az Az, »»», Ap, que es precisamente el bra básico correspon- 
diente. Y lo mismo ocurre con los operadores L,, Lz, ..., Ly definidos por la 
ecuación (1) y las consideraciones que la siguen. Con ayuda de esta defini- 
ción, todos estos resultados se pueden formular brevemente así: 


(i) Los bras básicos de una representación ortogonal son autobras co- 
munes a un conjunto completo de observables que conmutan. 

(ii) Dado un conjunto completo de observables que conmutan, podemos 
construir una representación ortogonal en la que los bras básicos 
son todos autobras comunes a todos los observables del conjunto 
completo. e 

(iii) Dado un conjunto cualquiera de observables que conmutan, siempre | 
es posible añadirle algunos observables más para formar un con- | 
junto completo. | | 

(iv) Para designar los bras básicos de una representación ortogonal, es 
conveniente utilizar los autovalores de los observables del conjunto 
completo del que dichos bras son autobras comunes. 


A los imaginarios conjugados de los bras básicos de una representación 
los denominaremos kets básicos de la representación. Así, si los bras básicos 
son <A1Az...Aul, los kets básicos serán |A122...Au>. El representante de un 
bra <b| vendrá dado por su producto escalar con cada uno de los kets 
fundamentales, es decir, por <b|A22...Au>. Igual como ocurría con el repre- 
sentante de un ket, también a éste se le puede considerar como un conjunto 
de números o como una función de las variables 2;,, Az, ... Au. Se tiene 


<DlMikz...Au> = <Mda...Aylb>, “- 


lo que nos dice que el representante de un bra es igual al complejo con- 
- jugado del representante del ket imaginario conjugado. En una represen- 
tación ortogonal en que los bras básicos son autobras comunes a un conjunto 
completo de observables que conmutan Es, Ez, ..., Eu, los kets básicos serán 
a su vez autokets comunes a És, Es, ..., E. 

Hasta ahora no hemos dicho nada acerca de las longitudes de los kets 
básicos. En una representación ortogonal es más natural normalizar los 
kets básicos que no tomarlos con longitudes arbitrarias, y con ello introdu- 
cimos una simplificación más en la representación. Pero sólo será posible 
normalizarlos cuando todos los parámetros que se necesitan para designarlos 


tomen únicamente valores discretos. Si alguno de los parámetros indicados * 


es una variable continua que puede tomar todos los valores de un cierto 
dominio de medida no nula, entonces los vectores básicos son autovectores 
de un cierto observable que pertenecen a autovalores de un conjunto de me- 
dida no nula y, por tanto, según la discusión de $ 10 (véase pág. 51) son de 


=— 
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longitud infinita. En este caso es necesario otro procedimiento para fijar 
los factores numéricos por los que pueden multiplicarse los vectores básicos. 
Para estudiar de un modo preciso esta cuestión es necesaria una nueva 
notación matemática, que se da en la sección siguiente. 


15. La función 3 


Los razonamientos de $ 10 nos llevaron a considerar cantidades que 
implican un tipo de infinito especial. Para manejar dichos infinitos con una 
notación rigurosa introducimos la cantidad 3(x) que depende de un pará- 
metro x y satisface las condiciones 


00 


j S(x) dx — 1 Ñ (2) 
8(x) = 0 para x0. 


Si queremos tener una imagen de 3(x), consideremos una' función de la 
variable real x que sea nula fuera de un pequeño dominio de amplitud e 
alrededor del origen x =0 y que en el interior de este dominio sea igual 
a uno. No importa la forma exacta de la función en el interior de este 
dominio, con tal de que no sufra en él variaciones innecesariamente bruscas 
(por ejemplo, con tal de que la función sea siempre del orden de s”?). 
Pasando al límite para e >0, esta función tenderá a confundirse con 3(x). 


8(x) no es una O O ordinaria de 
función — que le exigiría tener un valor definido para cada punto de su 
ominio — sino algo más general que llamaremos “función impropia” * para 
- destacar su diferencia con las funciones definidas de modo ordinario. Por 
tanto, 3(x) no es una cantidad que pueda usarse en análisis matemático con 
tanta generalidad como las funciones ordinarias, y su uso debe restringirse 
a ciertos tipos de expresiones sencillas para las que sea evidente que no 
puede dar lugar a inconsecuencias lógicas. 
La propiedad más importante de 3(x) puede expresarse con la siguiente 
ecuación, | 


Ús de=f0, 65) 


en la que f(x) es cualquier función continua de x. Es fácil ver la validez de 
esta ecuación a partir de la, imagen de 5(x) que acabamos de dar. El primer 
miembro de (3) sólo puede depender de los valores f(x) muy próximos al 


* La 3(x) que introdujo el autor de este modo heurístico ha dado lugar a la 
teoría de distribuciones de L. Schwarz, dentro de la cual ca definida con todo 
rigor. En honor al autor, 3(x) se denomina 3 de Dirac. (N. del T.) | 
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origen, de forma que sin error notable podemos sustituir f(x) por su valor 
en el origen f(0). La ecuación (3) resulta entonces como consecuencia de la 
primera de las ecuaciones (2). Haciendo un cambio de origen en (3), podemos 
deducir la fórmula 


| Je) (x —a) de =f(a), (4) 
. ——=00 
en la que a es un número real cualquiera. Luego, el resultado de multiplicar 
una función de x por s(x — a) e integrar para todo x es equivalente a susti- 
tuir x por a. Este resultado general es válido aunque la función de x no sea 
una función numérica, sino un vector o un operador lineal dependientes de x. 
El intervalo de integración en (3) y (4) no ha de ser necesariamente de —oo 
a +00, sino que puede ser cualquier dominio que incluya el punto crítico 
en el que la función $ no se anula. De ahora en adelante omitiremos de 
ordinario los límites de integración en ese tipo de ecuaciones, y daremos 
por sobreentendido que las integrales se extiendén a un dominio adecuado. 
Las ecuaciones (3) y (4) muestran que aunque una función impropia 
considerada aisladamente no tenga un valor bien definido, cuando aparece 
como factor en un integrando, la integral sí que tiene un valor bien defi- 
nido. En la teoría cuántica, siempre que aparece una función impropia 
aparece dentro de una expresión que finalmente colócaremos en un inte- 
grando. Por consiguiente, sería posible volver a escribir la teoría de forma 
que las funciones impropias aparecieran únicamente en integrandos. Y así 
se podría prescindir completamente de las funciones impropias. Así pues, 
el uso de las funciones impropias no implica ninguna falta de rigor en 
nuestra teoría, y no es más que una notación cómoda que nos permite 
expresar en forma concisa ciertas relaciones que, si fuera necesario, po- 
dríamos también escribir sin emplear funciones impropias, aunque esto 
resultaría muy engorroso y fácilmente oscurecería la idea central, 
Podemos definir la función 8 todavía de otro modo, como la derivada 
e(x) de la función e(x) definida así: 


e(x) =0 <0 
A 6 


Podemos comprobar que esta nueva definición es equivalente a la anterior, 
sustituyendo 3(x) por e'(x) en el primer miembro de (3) e integrando por 
partes. Si g, y g2 son dos números positivos cualesquiera, resulta 


Í oct de= Moeto]a, — 0 pt de 


93 9 


=46)—) 16 ds 
=10, 
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de acuerdo con (3). La función 8 aparece al derivar una función discontinua. 
Con las funciones 3 se pueden escribir algunas ecuaciones elementales. 

Tales ecuaciones son esencialmente reglas de manipulación para desarrollos 

algebraicos en que intervengan funciones 3. El sentido de cualquiera de 

estas ecuaciones es el de que sus dos miembros dan el mismo resultad 

empleados como factores en un integrando. | 
Ejemplos de estas ecuaciones son: . 


yu En 3d— x) =3(x) "S (6) 

- (a) =0, Y (7) 

| | as Se 3(ax) =a ix) (a>0), / (8) 
yr | 312 —a?) =jaU8(x—a) +3 + a) (a>0), (9) 

] fala—x) de (—b) =Ma—D), Y (10) 

gi fJ3(=—a) =f(aJ(x—a). (11) 


La ecuación (6), que enuncia simplemente el hecho de que 3(x) es una 
función par de la variable x, es trivial. Para comprobar (7) consideremos 
una función de x continua f(x) cualquiera. Para ella 


f flajad(x) dx = 0, 


según (3). Luego, x3(x) como factor en un integrando es equivalente a cero, 

y ese es precisamente el significado de (7). (8) y (9) pueden comprobarse 

mediante razonamientos elementales análogos: Para comprobar (10) consi- 
- deremos una función de a continua f(a) cualquiera. Para ella 


Ífia) daf sía—a) de da—b)= j d(«—b) de | fía) de d(a—a). 
= Lote —b) de fíx) = Fñca) da 3(a— b). 


Luego, los dos miembros de (10) son equivalentes cuando se emplean como 
factores de un integrando con a como variable de integración. Igualmente 
se puede demostrar que también son equivalentes como factores en un 
integrando con b como variable de integración, de forma que la ecuación (10) 
queda comprobada desde ambos puntos de vista. La ecuación (11) también 
puede comprobarse fácilmente desde ambos puntos de vista con ayu- 
da de (4). | | | 

La ecuación (10) resulta también como aplicación de (4) tomando f(x) = 
8(x — b). He aquí una ilustración del hecho de que muchas veces podamos 
usar una función impropia como si fuera una función continua ordinaria 
sin que ello nos lleve a ningún resultado incorrecto. 

- La ecuación (7) nos indica que al dividir ambos miembros de una ecua- 
ción por una variable x que pueda tomar el valor cero, debemos siempre 


y 
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añadir a uno de los miembros un múltiplo arbitrario de 3(x), es decir, que 
de la ecuación 


 —A=B, (19) 
no se puede deducir 

A/x =B/x, 
sino sólo 

A/x =B/x + c3(x), (13) 


siendo c un número desconocido. 
Como aplicación ilustrativa de la función 3(x), consideremos la derivada 
o W 


de log x. La forma usual o 
d 1 


debe ser examinada en el entorno de x — 0. Para 2 la función inversa 1/x 
quede definida en el entorno de x = 0 (en el sentido/de una función impro- 
pia) tenemos que imponerle una condición supletoria; por ejemplo que se 
anule su integral de —s a e. Con esta condición supletoria, la integral del 
segundo miembro de (14) de —s a e se anula, mientras que la del primer 


miembro resulta ser igual a log (—1), de donde (14) no es una ecuación | 


correcta. Para corregirla debemos recordar que log x tiene un término 
imaginario puro para los valores negativos de x, que si tomamos valores 
principales es igual a ix. Al pasar x por el valor cero, el término imaginario 
puro se anula de modo discontinuo. La derivada de dicho término resulta 
igual a —4m3(x), de forma que en vez de (14) habrá que escribir 


e ] . ¿73 1 
q PE x= —— rta). (15) 


Esta combinación especial de función inversa y función 3 que aparece 


en (15) juega un papel importante en la teoría cuántica de colisiones (véa- 
se $ 50). 


16. Propiedades de los vectores básicos 


Empleando la notación de la función 3, podemos continuar nuestra 
_teoría de las representaciones. Supongamos en primer lugar que un único 
observable constituye por sí solo un conjunto completo de observables 
que conmutan — para que esto se cumpla basta que £ no tenga más que 
un solo autoestado para cada autovalor E'—, y construyamos una repre- 
sentación ortogonal cuyos vectores básicos sean los autovectores de E que 
escribiremos <8E?, 18”. 

Si los autovalores de E son discretos, podemos normalizar los vectores 
básicos, y así tendremos E 0 


A 
oda 
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SEE") =0 (EE, 
<8185 = 1 
Estas dos ecuaciones se pueden combinar en una única ecuación 
SETE") = Bo (16) 


en la que el símbolo 3 con dos subíndices, que en adelante utilizaremos 
con frecuencia, vale 





Bre O si rs 


=1 si r=s8. y (7) 


Si los autovalores de E son continuos, e los 
vectores básicos. Pero si consideramos” la cantidad <g8'18”> con E” fija 
y E” variable, y recordamos nuestras reflexiones a propósito de la expre- 
sión (29) de $ 10, vemos que dicha cantidad se anula para ¿”+ E” y que 


su integral a lo largo de un intervalo de £” que contenga a E” toma un 
valor finito que llamaremos c. Tendremos, por tanto, 


«ENE = 084") 


Según (30) de $ 10, c es un número positivo. Puede variar con E”, por lo que 
conviene llamarle c(8') o c” para abreviar. Obtenemos pues la ecuación 


<E E» — ca(E—E””) (18) 
Hubiéramos podido obtener también 
<E E” == c3(E—E””, (19) 


en la que c”' es una abreviación de c(8”). Según (11) los ds miembros 
de (18) y (19) son iguales. 

Pasemos a otra representación cuyos vectores básicos sean también 
autovectores de E, por lo que los nuevos vectores básicos serán múltiplos 
de los anteriores. Llamando a los nuevos vectores básicos <E'*|, |E"*>, con el 
índice supletorio * para distinguirlos de los anteriores, tendremos 


<E*| = K<El, 18% = KIE»), 


siendo K' — abreviación de k(E') — un cierto número que depende de £?. 
Calculemos 


<E-PE5 — KR <E“E"> = E KK "Cc 3(E” E?” 
aplicando (18). Según (11) podemos escribirlo 
<E'*| 88) — KKC8E—E”) 
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Si elegimos k' de forma que su módulo sea c'”+ — siempre lo podremos 
“hacer ya que c” es positivo — lograremos que sea 


<E'*[8re> = 3(E'—£”). (20) 
De esta manera hemos fijado las longitudes de los nuevos vectores básicos 


para hacer la representación lo más simple posible. El proceso por el que 
hemos fijado las longitudes de estos vectores es en cierta manera análogo 
a la normalización de los vectores básicos en el en que los E” eran 
discretos, y la ecuación (20) es de la misma forma que la (16) pero con la 
función 3(8' — E”) en lugar del símbolo 3,.,.. En adelante manejaremos 
la nueva representación, y suprimiremos los índices * para simplificar la 
escritura. Así pues la ecuación (20) la escribiremos sencillamente 


<ENE"> = EE”). (21) 


Podemos desarrollar nuestra teoría con un paralelismo perfecto para 
ambos casos discreto y continuo. Para el caso discreto obtendremos, apli- 
cando (16), 

2 155518) = z [E >Bgrgr = 18>, 
E 


donde los sumatorios se ds ERAN a todos los autovalores. Esta ecuación es 
válida para cualquier ket básico |E”> y, por consiguiente, como los kets 
básicos forman un conjunto completo, tendremos 


y 
S EXE] =1. - 1 (ud, SO 2) 
| e 
Ésta es una ecuación muy útil, que expresa una propiedad importante de 
los vectores básicos: si |E”> se multiplica a la derecha por <E”| resulta un 
erador lineal que sumado para todo E' equivale al Elda unidad) ad) Las 
esuactones (18) y (22) nos dan las propiedades fundam e Os vectores 
básicos para el caso discreto. 
Análogamente para el caso continuo obtendremos, aplicando (21), 


Fw a e = | are”) = 15 (2) 
en la que hemos hecho uso de (4) con un vector ket en lugar de la función 


f(x), y donde la integral está extendida a todo el intervalo de los autovalores. 
Al ser esto válido para cualquier ket básico |5”>, será 


Fi ar e =1.- q feb (2) 


Esta ecuación es de la misma forma que (22) pero con una integral en lugar 
de una suma. Las ecuaciones (21) y (24) nos dan las propiedades fundamen- 
tales de los vectores básicos para el caso continuo. 

Las ecuaciones (22) y (24) permiten desarrollar dle bra o ket en 


A A 


es 





“16. PROPIEDADES DE LOS VECTORES BÁSICOS 75 


función de los vectores básicos. Por ejemplo, para el ket |P> en el caso 


discreto, multiplicando (22) a la derecha por |P>, obtendremos 
[P>=> [E>9<EP>, (25) 
a 


que nos da |P> expresado en función de los |5'> y nos muestra que los 


coeficientes de ese desarrollo <E'|P> q al pra 
constituyen el representante de |P>. Análogamente, para el caso continuo 


p> = Í 15> de <ETP», (26) 


que nos da |P> como una integral extendida a los |5”> con coeficientes en 
el integrando que constituyen también el representante <E//P> de IP>. 
Las ecuaciones conjugadas imaginarias de (25) y (26) nos darán el vector 
bra <P| expresado en función de los bras básicos. Y 

Los métodos matemáticos que manejamos ahora nos permiten desarro- 


Var cualquier ket en el caso continuo como una integral de autokets de é. 


Cuando no empleábamos la notación de la función 3, el desarreHo general 
de un ket consistía en una integral más una suma, tal como la ecuación (25) 
de $ 10. Pero la función 3 nos permite ahora sustituir la suma por una 
integral, cuyo integrando consta de una serie de términos, cada uno de los 
cuales contiene una función 3 como factor. Por ejemplo, el autoket |£”> 
puede sustituirse por una ifegral de autokets según la segunda de las 


ecuaciones (23). 


Si <Q| es un bra cualquiera y |P> un ket cualquiera, aplicando de nuevo 
(22) y (24) obtendremos, para ¿' discretos 


| <QlP> = Y <Q1EN<ETP> ) (27) 
y para £' continuos : | 


<QIp> = j <QlE”> dEl <ElP> (28) 


Estas ecuaciones expresan, el producto escalar de <Q! y |P> en función 
de sus representantes <Q1E»> y <E'P>. La ecuación (27) es exactamente la 
fórmula usual del producto escalar de dos vectores en función de sus 
coordenadas, y (28) es la modificación natural de esta fórmula para el 
caso de E” continuo, con una integral en vez de un sumatorio. | 
La generalización de las consideraciones precedentes para el caso en 
que E tenga a la vez autovalores discretos y continuos no ofrece ninguna 
dificultad. Usando E" y E* para indicar autovalores discretos, y E” y E” 
para indicar autovalores continuos, obtendremos el conjunto de ecuaciones 


<EES> = Burro  <EMED> =0,  <ElE”> = ME —E”) (29) 


- como generalización de (16) o (21). Estas ecuaciones expresan que los vecto- 


res básicos son todos ortogonales, y que los correspondientes a autovalores 
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continuos tienen fijadas sus longitudes según el mismo criterio con que 
dedujimos (20). A partir de (29) podemos obtener la generalización de 
(22) O (24) > | 


y lEn< + | je) a <= 1, (30) 


cuya integral está extendida a todo el dominio de los autovalores continuos. 


Ss 


De (30) resulta inmediatamente / 


P> = Y lEN<ETP> + $ 15) ax <E1p> (31) 


¿r 
que es la generalización de (25) o (26), y 


<QIP> = Y <QlEN<ETP> +) <QlE> de <EtP> (82) 
ir 
que generaliza a (27) o (28). | 
Pasemos al caso general en que haya varios observables que conmutan 
51, 2, -»»» Eu que forman un conjunto completo, y construyamos una repre- 
sentación ortogonal cuyos vectores básicos, que escribiremos <8/...E”l, 
ES .-»5,>, Sean autovectores comunes a todos ellos. Supongamos que £1, 82, 
..:, Ey (0 < u) tengan autovalores discretos y Ev+1, -»:, Eu tengan autovalores 
continuos. | 
Consideremos el producto escalar CR PTE A AER 0 A 
Según el teorema de ortogonalidad debe ser nulo a no ser que E/ =E/ para 
cada s=0+1, ..., u. Si generalizamos las consideraciones que hicimos 
sobre la expresión (29) de $ 10 para aplicarlas a autovectores comunes a un 
conjunto de varios observables que conmutan y generalizando también 
el axioma (30), la integral (u — 0)-ésima de dicho producto escalar respecto 
a cada Sl a lo largo de un intervalo que contenga el valor E" es un número 


finito positivo. Llamando c' a dicho número —el acento indica que c' es 
función de 5 ss E, E, is E, —, nuestros resultados pueden expresarse 


mediante la ecuación : 
rl E? E Ud E, EN (83) 


en la que figura un factor 3 en el segundo miembro para cada valor de s 
desde v + la u. Podemos cambiar ahora las longitudes de nuestros vectores 
básicos, mediante un procedimiento análogo al que nos condujo a (20), de 
forma que resulte c' igual a uno. Usando de nuevo el teorema de ortogona- 


lidad, obtenemos por fin 
<E! 81 18%...8> — Ser er:+9 ce, E) E E, (34) 


en cuyo segundo miembro figura un símbolo 3 con dos subíndices para 
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cada E de autovalores discretos, y una función 3 para cada E de autovalores 
continuos. Esta ecuación generaliza la (16) o (21) para el caso de un con- 
junto completo de varios observables que conmutan. 

De (34) se puede deducir la generalización de (22) o (24) 


] f... fé... dz ...der <E,..El = 1 (35) 


€"" .. 


en la que figura una integral (u — v)-ésima extendida a todas las £' de auto- 
- valores continuos y un sumatorio para todas las E” de autovalores discretos. 
Las ecuaciones (34) y (35) nos dan las propiedades fundamentales de los 
vectores básicos para el caso que estamos estudiando. A partir de (35) pode- 
mos escribir inmediatamente la generalización de (25) o (26) y la de 
(27) o (28). | 

El caso que acabamos de considerar se puede generalizar todavía, per- 
mitiendo que algunos de los observables E tengan a la vez autovalores 
discretos y continuos. Las modificaciones que hay que introducir en las 
ecuaciones son inmediatas, pero no las introduciremos porque son bastante 
engorrosas de escribir en forma general. 

Hay problemas para los que en lugar de hacer que la c” de la ecua- 
ción (33) valga la unidad, resulta más conveniente hacerla igual a una cierta 
función de las E”. Si llamamos p”* a dicha función, en lugar de (34) ten- 
dremos 


EEE = 8 pr E, EE (88) 
y en lugar de (35) tendremos 


» ¡e $ re... p! dE EE E] = 1. (37) 
es, 


p” suele llamarse función de peso de la representación, por ser p” dE. yo dE 
el peso” que se atribuye-=un pequeño elemento de volumen del espacio de 
variables a? mud E, ; 

Todas las representaciones que hemos considerado anteriormente tienen 
la función de peso unidad. La introducción de una función de peso no 
unidad es enteramente cuestión de > conveniencia, pues la representación 
no resulta con ello más potente desde el punto de vista matemático. Los 
bras básicos E Bl de una representación de función de peso p” se rela- 
cionan con los bras básicos <8/ ...E' | de la representación correspondiente 
de función de peso unidad mediante 


EE] = po... E (38) 


como es fácil comprobar. Un ejemplo de representación muy útil con 
función de peso no unidad es cuando dos E' son los ángulos polar y azimu- 
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tal 0 y $ que dan la dirección en un espacio tridimensional. Conviene tomar 
entonces p” = sen 6”, con po (37) aparecerá el elemento de ángulo 


sólido sen Y d4' do”. 


17. Representación de operadores lineales 


Vimos en $ 14 cómo se pueden representar los vectores ket y bra me- 
diante un conjunto de números. Ahora hemos de hacer lo mismo con los 
operadores lineales, para tener así un completo que nos permita 
representar todas nuestras cantidades abstractas mediante conjuntos de  * 
números. Para ello podemos utilizar los mismos vectores básicos de $ 14. 

Supongamos que los vectores básicos son autovectores comunes a un con- 


a - 


junto completo de observables que conmutan Es, Es, ..., Eu Dado un ope- 


“rador lineal « cualquiera, tomemos un bra básico general <£' ...£”| y un 
ket básico general |8”...8”>, y formemos los números ES " 
1 u E A MN e: y - AS 
EE lalBr..EM. (89) 


Estos números son suficientes para determinar a completamente, puesto 
que en primer lugar determinan el ket transformado ale ...5> (ya que 


dan su representante), y al determinar el ket transformado para cada uno 
de los kets básicos E a Er > queda determinado «a. Los números (39) 


constituyen el A 
dinámica-«. Este representante es más complicado que el de un vector ket 
o bra, ya que encierra los parámetros que designan a dos vectores básicos 
en lugar de uno. | 
Examinemos la forma de estos números en casos sencillos. Consideremos 

el caso en que un solo observable E constituye por sí solo un conjunto 
completo, y supongamos que sus autovalores £” sean discretos. Entonces 
el representante de «a está constituido por el conjunto discreto de números 
<ElajE”>. Al escribir explícitamente estos números, es natural distribuirlos 
en una disposición bidimensional así: Ñ 

<EMdalE>  <EalE?>  <E*lalES> 

<ElE2>  <E*a]E2> <ElaE3S) .. 

<ESaiED  <E*lAJE2> <E*alE3) . . (40) 


ONE 
gan 


mo” ne 
A 
e E 


ES 
siendo El, 2 E3 ...(los autoValores de E. Este tipo de disposición se deno- 
mina matriz, y sus números, elementos de la matriz. Hacemos la convención 
- de que los elementos que figuren en una misma fila pertenezcan siempre al 
mismo bra básico, y los de una misma columna a un mismo ket básico. 
Un elemento <E'la[5”> correspondiente a dos vectores básicos con el 


a NA OS SAA A 
A, EIN | 0d a i 
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mismo índice se llama elemento diagonal de la matriz, pues todos los ele- 
mentos de ese tipo están sobre una diagonal. Si hacemos « igual a la unidad, 
según (16), todos los elementos diagonales valdrán la unidad y todos los 
demás elementos serán nulo$/ Dicha matriz recibe el nombre de matriz 
unidad. 


Si a es real, tenemos prin £ JN 


ps e 
<ElajE"> = ETE. cz Y (41) 


Estas condiciones exigen que todos los elementos diagonales de la ma- 
triz (40) sean reales y que cada uno de los otros sea igual al complejo conju- 
gado de su simétrico respecto a la diagonal. Una matriz de este tipo se 
denomina matriz hermítica. | 

Si hacemos « igual a É, oBtenemos como elemento general de la matriz 


CEMIS") = EXEIE) = Epa y (42) 

O sea, que todos los elenientos que no están en la diagonal son nulos. Una 

matriz así se denomina matriz diagonal. Sus elementos diagonales son preci- 

samente los autovalores de E. Generalizando, si hacemos « igual a f(8) 
— una función cualquiera de E — obtenemos | 

<EMBIES = EN qe q (43) 


y la matriz que se obtiene también es diagonal. 

Tratemos de hallar el representante del producto «8 de los operadores 
lineales « y £ en función de los representantes de los factores. Usando la 
ecuación (22) con £”” en vez de E” obtenemos 


<E(x«plE”> —= <Elo > 18><E"1B1E> 
— > CEalEm><EMBIE”, 


A 
que nos da el resultado que buscábamos. La ecuación (44) expresa que la 
matriz formada por los elementos <EJa8lE”> es igual al producto de las 

- matrices formadas respectivamente por los elementos <E'a]8”> y <E 818”), 
obtenido por la regla matemática ordinaria de multiplicación de matrices. 
Esta regla nos da como elemento perteneciente a la fila r-ésima y a la 
columna s-ésima de la matriz producto, la suma de los productos de cada 
elemento de la fila r-ésima de la primera matriz por el correspondiente 
elemento de la columna s-ésima de la segunda matriz. La multiplicación de 
matrices, igual que la de operadores lineales no es conmutativa. 

Para este primer caso de un solo observable E con autovalores discretos 
podemos resumir nuestros resultados del modo siguiente: 


(i) Todo operador lineal está r entado por una matriz. Y : 
(ii) El operador unidad está representado por la matriz unidad. 4 


(44) 


AS 
(1 Ñ A $ 


o ES 
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Ñ (iii) Los operadores lineales reales. están representados por ya El 
: hermíticas. (o 4. HH mt rn BUY) 
Puro _p(iv) E y las funciones de E están re resentados por matrices diag 
Ya O (v) La matriz que representa el producto de dos operadores s 
| es igual al producto de las matrices que representan los dos fac- 
tores. | 


Consideremos ahora el caso de un solo observable £ con autovalores 
continuos. El representante de a, <E'Ja[£”> es en este caso una función de 
dos variables E' y £” que pueden variar continuamente, Es muy conveniente 
llamar a esta función “matriz, generalizando el sentido de esta palabra, 
para así poder utilizar la misma terminología en el caso discreto y en el 

SS continuo. Por supuesto, tales matrices generalizadas ya mo pueden escri- 
3 birse, como ocurre con las matrices ordinarias, en una disposición bidimen- 
E sional, ya que el número de filas y columnas es una infinidad del mismo 
== orden que el número de puntos de una recta y el número de sus elementos: 

Pl 1. Una infinidad del mismo orden que el número de puntos de una superficie. 
E Daremos nuestras definiciones para estas matrices generalizadas de 
iS forma que sigan valiendo para el caso continuo las reglas (1)-(v) del caso 

SS discreto. a por 3(5'—8”) y la matriz 
¡ X generalizada formada por estos elementos será por id de aa 
: _unidad. La ecuación (41) seguirá siendo la condición para que « sea real, 
y por definición, diremos-.que una matriz generalizada es hermítica cuando 


Y 
SÍ Ñ sus elementos <E'a|E”> cumplan dicha condición. E está representado por 
N | <ETElE"> = ENEE”) (45) 


EMENE = ENE", (46) 


EA y las matrices generalizadas formadas por tales elementos diremos que son 
S “matrices di s. Según (11) hubiéramos podido escribir también E” 
Y 7 1(£”) como coeficientes de las 3(£”—E”) en los segundos miembros de (45) 


y f(€) por 


y (46) respectivamente. Usando (24) obtenemos la ecuación correspon- 
diente a (44) 


«Elaplg” = | <Elalg”> de <empaler, (47) 


en que figura una integral en vez de una suma, y diremos que la matriz 
formada por los elementos del segundo miembro es por Aefinición el pro- 
ducto de las matrices formadas por <E/la]E”> y_<E"]g|E”>' Con estas defini- 
ciones logramos un completo paralelismo entre el caso discreto y el con- 
tinuo, de forma que las reglas (i)-(v) valen para ambos casos. | 

Surge el problema de definir cuándo una matriz general es diagonal, 
puesto que hasta ahora sólo hemos dicho que los seguros membres 35 (85 


y (46) son ejemplos de matrices diagonales. Podríamos de suyo inclinarnos 


AN a Ñ e nao? > e ye N AA 

- z A . , no b + , - 

Os . no , , a o 
A : ] : + o pS 
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a definir como diagonal cualquier matriz cuyos elementos (E, £”) fueran 
todos nulos salvo los correspondientes a valores de E” que difieren infinita- 


mente poco de E”. Pero esta definición no sería satisfactoria, pues en el 
discreto las matrices diagonales gozan de una propiedad im te, 


la de conmutar siempre entre sí, y queremos que dicha propiedad siga 


valiendo también para el caso continuo. Para que en el caso continuo la 
matriz formada por los elementos <Z'lw|5”> conmute con la formada por 
los elementos del segundo miembro de (45), ha de verificarse, según la 
regla de multiplicación (47) 
| <ElolE"> dE” Er 3(E"—E”) pon f E! 3(E'— E”) dE" <E"lojE”. 
Usando la fórmula (4), la anterior se reduce a 
<E 188” = ExElol8”> (48) 
(E —E"K8oJE”> — (. 
Y según la regla por la que de (12) dedujimos (13) esto equivale a 
<EloJE"> = ('3(E'—E””) 


donde £' es un número que puede depender de £'. Luego, <E'llE”> es de 
la forma del segundo miembro de (46). Por esta razón diremos que única- 







o sea 


mente las matrices cuyos elementos son de la forma del segundo miembro 





de (46) son por definición matrices diagonales. Es fácil comprobar que tales 
matrices conmutan todas entre sí. Se pueden formar otras matrices cuyos 
elementos (E, E”) sean todos nulos cuando $” difiera apreciablemente de £” 
y que tengan otra forma de singularidad para £' igual a E” (más adelante 
introduciremos la derivada 3'(x) de la función 3, y 3(£'—£”) constituirá un 
- ejempla de ello; véase $ ecuación (19)], pero tales matrices no serán diago- 
nales según nuestra definición. 

Pasemos ahora. al caso de un solo £ con autovalores de ambas clases, 
discretos y continuos. Llamemos E, E* a los autovalores discretos y E”, E” 
a los continuos. El representante de « constará ahora de cuatro clases de 
cantidades: <E'lal£*>, <ErJalE”>, <ElalE">, <EJa[E”>. Podemos considerar 
que el conjunto de estas cantidades forman un tipo de matriz más general 
con ciertas filas y columnas discretas e intervalos continuos de filas y colum- 
nas. Para este tipo de matrices más general definiremos también la matriz 
unidad, los conceptos de matriz hermítica y de matriz diagonal y el pro- 
ducto de matrices, de forma que sigan siendo válidas las reglas (i)-(v). Los 
detalles son una generalización inmediata de lo que acabamos de hacer, 
y no vale la pena explicitarlos. i 

Volvamos de nuevo al caso general de varios observables E, Es, ... En. 
El representante de a, dado por la expresión (39), puede considerarse tam- 
bién como una matriz, cuyas filas corresponden a -diferentes valores de 
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E» +» 5, y las columnas a diferentes valores de E” ..., E”. Salvo en el 
caso de que todos los E tengan únicamente autovalores discretos, esta matriz 
será del tipo generalizado con intervalos continuos de filas y columnas. 
Podemos modificar nuestras definiciones de forma que las reglas (i)-(v) sigan 
siendo válidas, si generalizamos la regla (iv) del modo siguiente: 

(iv) Cada uno de los Em (m = 1, 2, ..., u) y todas las funciones de ellos 
están representados por matrices diagonales. 

En este caso, diremos que una matriz es diagonal cuando su elemento 
general <8/ ...E' lol87...8”> sea de la forma 


<E EM olE/...EN) = 08 yy gqo0 Br ao, — EY )...8(E-—A7) — (49) 


donde suponemos que Ej, ..., Ey tienen autovalores discretos y Ev+1, ..., Eu. 
los tienen continuos, y siendo c” una función cualquiera de los E”. Esta defi- 
nición es una generalización de la dada para el caso de un solo E, y de ella 
se deduce que las matrices diagonales siempre conmutan entre sí. Las demás 
definiciones son inmediatas y no vale la pena explicitarlas. | 
De este modo, todo operador lineal está representado por una matriz. 
La suma de dos operadores lineales está representada por la matriz suma 
de las que representan ambos operadores, lo que junto con la regla (v) nos 


dice que les matrices están sujetas a las mismas operaciones agebedoas 
que los operadores, Cualquier ecuación algebraica válida entre operadores 
lineales también será válida entre las matrices que representan a dichos 
operadores. 


Podemos ampliar nuestro esquema de matrices para que abarque tam- 
cora a los representantes de los vectores bra y ket. Todas las matrices que . 


esenta eradores lineales son matrices cuadradas con el mismo nú- 
mero de filas que de columnas, o mejor ; una correspondencia 


_biyectiva entre sus filas y sus columnas. Podemos considerar el representante 


de un ket |P> como una matriz de una sola columna, obtenida colocando 
uno debajo de otro todos los números <8” ...¿' |P> que forman dicho repre- 
sentante. El número de filas de esta matriz será igual al número de filas o 
de columnas de las matrices cuadradas que representan operadores lineales. 
Tal matriz de una columna puede multiplicarse a su izquierda por la matriz 
cuadrada E E 57. e que representa un operador lineal, mediante 
una regla análoga a la de multiplicación de matrices cuadradas. El pro- 
ducto es una matriz también de una sola columna cuyos elementos vienen 
dados por 


¿Y y mu $ «Er... 8Jal8?...E7> dE de” <E"...EnP». 


Según Pen esto es precisamente igual a <E; ...E/ la]P>, o sea al represen- 
tante de a]P>. Análogamente podemos considerar el representante de un 


Í 


Ju A pr 
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7 bra <Q| como una matriz de una sola fila, obtenida colocando uno al lado 


de: otro todos los números <Ql5' ...£” >. Tal matriz de una fila puede multi- 
plicarse a la derecha por una matriz cuadrada <£/...E/ lajE”...E”>, y el 
producto será otra matriz de una sola fila que es precisamente igual al repre- 
sentante de <Qla. La matriz de una sola fila que representa a <Q| puede 
multiplicarse a la derecha por la matriz de una sola columna que representa 


- a |P>, y el producto será una matriz de un solo elemento que vale <Q|P>. 
Finalmente, la matriz de una sola fila que representa a <Q| puede multi- 
plicarse a la izquierda por la matriz de una sola columna que representa 


a |P>, y el producto será una matriz cuadrada que es precisamente igual 


a 





_al representante de |P><Q]. De este modo todos nuestros símbolos abstrac- 


tos — operadores lineales, vectores bra y vectores ket — pueden represen- 
tarse por matrices que están sujetas a las mismas operaciones algebraicas 
que los correspondientes símbolos abstractos. 


- 18. Amplitudes de probabilidad 


Las representaciones son muy importantes en la prole física de 
la mecánica cuántica, ya que nos proporcionan un método práctico de ob- 
tener las probabilidades de que los observables tengan valores dados. 


En Y 12 obtuvimos la probabilidad de que un observable tenga un valor 


determinado cualquiera para un estado dado, y en $ 13, generalizando 
este resultado, obtuvimos la probabilidad de que un conjunto de obser- 
vables que conmutan tengan simultáneamente unos valores determinados 
para un estado dado. Apliquemos ahora este resultado a un conjunto 
completo de observables que conmutan, es decir, al conjunto de los E que 
venimos estudiando. Según la fórmula (51) de $ 13, la probabilidad de 
que para el estado correspondiente al ket normalizado |x> cada uno de los 


E, tenga el valor Ef es ? 


Po (50) 


E 


5 Ñ / Si todos los E tienen autovalores discretos, podemos emplear (35) con v = u 


f 

- 1 

1 

E 1 
e ás 4 Ñ 


-y sin integrales, con lo que resulta 


a 18207 7 » ” 
Peg E Be ego e EEE 
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Así obtenemos el resultado sencillo que podemos enunciar del siguiente 
modo: la probabilidad de que para un cierto estado los E tengan valo- 
res El es igual al cuadrado del módulo de la coordenada pde a iente 
del ket normalizado relativo al estado en cuestión. ; ¿A rito e de) 
Si no todos los £ tienen autovalores discretos, y por ejemp E e. En 
tienen autovalores discretos y Ev+1» -».» Gu los tienen continuos, entonces para 
que el resultado tenga sentido físico, hemos de calcular la probabilidad 
de que cada E, (r=1, ..., 0) tenga un valor determinado E' y cada É£, 
(s=0-+1, ..., u) tenga valores comprendidos en un pequeño intervalo 
determinado (Er, E! + dE ). Para ello hemos de reemplazar cada factor 3, 
que figura en (30) por un factor Ys, Que es la función del observable E, que : 
vale uno cuando £, toma valores dómprendidos en el intervalo (8 E'+ der) 
y cero para cualquier otro caso. Operando como antes a partir” de (35) 


A ea re para dicha probabilidad el valor + 4 y 6 E 
3. : qc de E Pe, es de dEl En ] El. e lx> p? dE, dE? , y J V (52) 
a e 


ES > As pues, en todos los casos la distribución de En de e valores 
ta ¿x - do Ae los E para un cierto estado viene dada por el cuadrado del módulo del 
So La _ ¿y Tepresentante del ket normalizado correspondiente a dicho estado. 
a Con ello queda justificado que a los números que constituyen el repre- 
y A Sentante de un ket (o bra) normalizado se les denomine empiitudes de 
a da d. El cuadrado del módulo de una amplitud de probabilida 
2 $es una probabilidad ordinaria, o una probabilidad por unidad de rd | 
para aquellas variables que toman valores en intervalos continuos. [ 4% En 
Puede ocurrir que nos interese un estado cuyo ket correspondiente” [> 
no pueda normalizarse. Por ejemplo, cuando el estado es un autoestado ' Ser 
de un observable que pertenece a un autovalor comprendido en un inter- 
valo continuo de autovalores. Las fórmulas (51) y (52) siguen siendo válidas 
en este caso, y darán la probabilidad relativa de que los £ tengan valores 
determinados o tengan valores comprendidos en pequeños intervalos pre- 
fijados, es decir, nos darán correctamente la relación entre las probabilida- 
des para los distintos £'. Los números E, E, lx> se denominan en este 
caso amplitudes de probabilidad relativa. | 
La representación en la que son válidos los resultados anteriores se 
caracteriza por tener unos vectores básicos que son autovalores comunes 
dos los E. Puede caracterizarse también por la existencia de que cada 
t una matriz diagonal, ya que puede verse 
fácilmente que esta condición equivale a la anterior. Este segundo modo 
de caracterizarla es de ordinario el más práctico, y lo formularemos breve-. 
mente diciendo que cada uno-de-los E “es diagonal en la representación”. 
Si los £ forman un conjunto completo de observables que conmutan, la 
representación queda completamente determinada por esta caracterización, 
a menos de un factor de fase arbitrario en los vectores básicos. Cada bra 









de “básico E E | puede multiplicarse por 7) — siendo Y' cualquier función 


“real de las variables E”, +» E —sin que cambie por ello ninguna de las 





- condiciones que ha de A A la representación, es decir, la condición 


EOS - de que los É sean diagonales o la de que los vectores básicos sean autovec- 


tores comunes a los E y las propiedades fundamentales de los vectores bási- 
cos (34) y (35). Cuando cambiamos los vectores básicos de este modo, el 


- representante <E” ...E” |[P> de un ket |P> queda multiplicado por e”, el re- 


presentante <QlE! .. $4 de un bra <Q| queda multiplicado por e”tr y 


el representante < E Er laJE”.. 51 de un operador lineal «4 queda multi- 


plicado por ettY- »” , Evidentemente, las probabilidades o probabilidades 


relativas (51) y (52) quedan inalteradas. 
Las obablidade que se calculan en los problemas prácticos de mecá- 
nica cuántica se obtienen casi siempre a partir de los cuadrados de los 


- módulos de amplitudes de probabilidad o amplitudes de probabilidad 
- relativa, Incluso en el caso de que sólo interese la probabilidad de que un 


conjunto incompleto de observables que conmutan tengan valores deter- 
minados, de ordinario es necesario construir primero un conjunto completo 
introduciendo para ello nuevos observables que conmutan. A continuación 
obtener la probabilidad de que el conjunto completo tenga determinados 
valores (elevando al cuadrado el módulo de la amplitud de probabilidad), 
y después sumar o integrar estas probabilidades para todos los valores 
posibles de los observables suplementarios. De ordinario no es viable una 


aplicación más di directa de la fórmula (51) de $ 13... 
A PP 
- Enla práctica, para introducir una AS b 





IS buscamos observables que convendría que fueran diagonales, bien 
porque nos interesa conocer sus probabilidades o bien por razones 

de simplificación matemática; 

_ (ii) hemos de comprobar si todos ellos conmutan (condición necesaria, 


ya que las matrices diagonales siempre canmutan) | 
(iii) comprobamos si forman un conjunto completo, y si no es así, aña- 
dimos más observables que conmutan hasta formar un conjunto 


completo de observables que conmutan; 
(iv) establecemos una representación ortogonal en la que este conjunto 


. completo de observables sea diagonal. 

La representación estará entonces completamente determinada a menos 
de los factores de fase arbitrarios. En la mayor parte de los casos estos 
factores de fase arbitrarios carecen de importancia y son triviales, de forma 
que podemos considerar la representación como completamente determi- 
nada por los observables que son diagonales en ella. Este hecho lo hemos 
supuesto ya en nuestra notación al escribir en los representantes unas letras 
que indican qué observables son diagonales en ella, como única indicación 





de la representación a la que pertenecen. 





xs 








Py 
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Puede ocurrir que nos interese utilizar dos representaciones para un 
mismo sistema dinámico. Supongamos que el conjunto completo de obser- 


E - vables que conmutan y que son diagonales sea en una de ellas E, ..., Es, 


y en la otra ni, ..., Mo. Los bras básicos de la primera representación serán 
<E...5'|, y los de la segunda <v/...1 |. Un ket [P> tendrá ahora dos 
representantes: EE, |P> y <q, Y, |[P>. Si Ex, ..., Ey tienen autovalores 
discretos y Ep,1, .... Eu los tienen continuos, y si m1, ..., + tienen autova- 
lores discretos y Nw+1, -»-, Mw los tienen continuos, de (35) obtenemos 


an = 3 of «0.1 l8...8> dE, dE”, <E/...E.1P>, (59) 


ti. t, 


e intercambiando las E y las y 


«Er ..EP) = Y j 0 El, de, de, <P> (59) 


Estas son las ecuaciones de transformación que nos dan un representante 
de |P> en función del otro. En ella vemos que cada representante se puede 
expresar linealmente en función del otro, con los coeficientes 


SMA <El El Im +07, (55) 


Estas cantidades se denominan funciones de transformación. Se pueden 
escribir ecuaciones análogas para relacionar los dos representantes de un 
vector bra o de un operador lineal. Las funciones de transformación (55) 
son el artificio que permite pasar en todos los casos de una representación 
a otra. Las funciones de transformación son complejas conjugadas unas de 
otras, y satisfacen las condiciones 


E |. ara E) de, de EE 
ato 


= Bum Inrena — 124 1)-¿(nio — mio (56) 
y las condiciones correspondientes obtenidas por intercambio de las E con 
los y, como puede comprobarse fácilmente a partir de (35) y (34) y las 
correspondientes ecuaciones para los 1. 

Las funciones de transformación son -ejemplos de amplitudes de pro- 
babilidad o amplitudes de probabilidad relativa. Consideremos el caso en 
que tanto los E como los y tienen únicamente autovalores discretos. En este 
caso, el ket básico |n...m > está normalizado, y su representante en la 
representación E, <E. E, in ...1/ >», es una amplitud de probabilidad para 
cada conjunto de valores de las É”, El estado al que se refieren dichas am- 
plitudes de probabilidad, o sea el estado correspondiente a |n/ ...1 >, está 
caracterizado por la condición de que una medida simultánea de los 
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observables 1, ..., ho dé con seguridad los resultados Y » ...» Y . En conse- 
cuencia, [<E/...E | “1 1? es la probabilidad de que los É tengan los 
valores E”, ..., E” para el estado en que los y tienen con seguridad los valo- 


res > ua a. Y puesto que 
NAPA P=1<0 1 18-52 PB, 


tenemos el siguiente teorema de reciprocidad: la probabilidad de que los E 
tengan los valores E' para un estado en el que los y tienen ciertamente los 
valores y/, es igual a la probabilidad de que los y tengan los valores «' para 
un estado en el que los E tienen ciertamente los valores E”. | 

- Si todos los y tienen autovalores discretos y algunos £ tienen auto- 
valores continuos, |<8/ ...E' |n/...n > PP sigue dándonos la distribución de 
probabilidad de los valores de los £ para el estado en el que los r 
tienen ciertamente los valores *Y. Si algunos de los y tienen autovalores 
continuos, in ..«1 » no está normalizado y en este caso | <é' E LS > 
únicamente nos da la distribución de probabilidad relativa de los valores 
de los E para el estado en el que los « tienen ciertamente los valores 1/. 


19. Teoremas sobre funciones de observables 


. Vamos a poner de manifiesto el valor matemático de las representaciones, 
utilizándolas para demostrar algunos teoremas. A 
Teorema 1. Todo operador lineal que conmuta con un observable 5) 
onmuta también con cualquier función de E. 
El teorema es evidente si la función puede expresarse en serie de poten- 
cias. Para demostrarlo en el caso general, sea « el operador lineal en cues- 
tión, que verificará la ecuación | 


Eo —uk =0. | (57) 


Introduzcamos una representación en la que E sea diagonal. Si E por sí solo 
no constituye un conjunto completo de observables, tendremos que añadir 
nuevos observables $ a fin de tener un conjunto completo, y elegir entonces 
una representación en la que E y los $ sean diagonales. (El caso en que E 
- constituye por sí solo un conjunto completo de observables podemos consi- 
derarlo como un caso particular del anterior, donde el número de varia- 
bles $8 es cero.) En esta representación, la ecuación (57) se convierte en 


«EP lo — 081878" =0, 
E'XE'BlolE”p”> uN <E'Blo187p”> E” — O. 


Si los autovalores de E son discretos, esta ecuación muestra que todos los 
elementos <E'B' [.1878”> de la matriz de « son nulos excepto aquellos para 


que se reduce a 
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los que E! = E”. Si los autovalores de E son continuos, la ecuación muestr 
— igual que (48) —que <¿'B lwl5”8”> es de la forma | 


| <EBlolE”8”> =c3(E'—E”, 

siendo c una cierta función de £”, de las f” y de las f”. En ambos casos 
podemos decir que la matriz que representa « “es diagonal respecto a E. 
Si llamamos f(5) a una función cualquiera de E, de acuerdo con la teoría - 
general de $ 11, f(8””) ha de estar definida para todo autovalor E” de E, 


y tanto en uno como en otro caso podemos deducir 


Í (ENE BlolE"B”> — <E'Pllo18"8">1(8”) =0. 
De donde resulta 


<E'81f(E)o —of(E)18"8) =0, 
(Eo —of($) =0 


O sea 


quedando así demostrado el teorema. 


Como caso particular del teorema, llegamos a la conclusión de que todo 
observable que conmuta con un observable E conmuta también con cual- 
quier función de E. Esta conclusión aparece como una necesidad física, 
si identificamos — como lo hicimos en $ 13—la condición de conmutabi- 
lidad de dos observables con la condición de compatibilidad de las obser- 
vaciones correspondientes. Cualquier observación compatible con la medida 
de un observable E ha de ser también compatible con la medida de f(8), 
ya que toda medida de E incluye en sí misma la medida de (3). 

- Teorema 2, Todo operador lineal que conmuta con cada uno de los 


- observables de un conjunto completo es función de dichos observables. 


Sea «w el operador lineal en cuestión, y £1, Ez, ..., 8u el conjunto completo 
de observables que conmutan. Introduzcamos una representación en la que 
estos observables sean diagonales. Puesto que « conmuta con cada uno 
de los E, su matriz representante es diagonal con respecto a cada uno de 
los E según el razonamiento anterior. Por tanto, dicha matriz es diagonal, 
y es de la forma (49) con un número c' función de las E”. Esta matriz es el 
representante de la función de los E que tenga la misma forma que la fun- 
ción c' de las E”, de donde « es igual a dicha función de los É£. 

TEOREMA 3. Si un observable E y un operador lineal g son tales que 
todo operador lineal que conmuta con E conmuta también con g, entonces g 
es función de É. | 

Este es el recíproco del teorema 1. Para demostrarlo emplearemos la 
misma representación del teorema 1, en la que £ es diagonal. Observemos 
previamente que g conmuta con É y, por tanto, el representante de « ha de 
ser diagonal respecto a E, es decir, ha de ser de la forma 


<E'B lglB"8"> =aE BB jr O bien aEp paa — E”, 


según tenga E autovalores discreto3 o continuos. Sea « un operador lineal 
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- cualquiera que conmuta con E cuyo representante será, en consecuencia, 
de la forma | 


2 CEBO =MEBM Rp o bien HEBER E” 
¿2 Por hipótesis «+ conmuta también con g, luego | 
<E'B go EE vglE”"B”> —0. (58) 


| Pongamos por caso que las £ tengan autovalores discretos. A partir de (58), 
aplicando la ley de multiplicación de matrices, se llega a 


| y (AEB BUDEB"B” — b(E'B'p"MaE'p”B”) =0, (59) 
pr” 


ya que el primer miembro de (58) es igual al primer miembro de (59) mul- 
tiplicado por 8,,¿. o 3(E” — E”). La ecuación (59) ha de ser válida para toda 
función b(E'g”8”). De ello deducimos que 


a(E'p'g”")=0 para BB”, 
a(E'P'p”) =a(E'B"B”). 
El primero de estos resultados expresa que la matriz representante de ges 
diagonal y el segundo que a(E'B"8”) únicamente es función de E”. De aquí 
podemos deducir que g es la misma función de E que a(<'B'B”) es de £', 
quedando así demostrado el teorema. La demostración es análoga si algunos 
- de los £ tienen autovalores continuos. 
Los teoremas 1 y 3 siguen siendo válidos si reemplazamos el observa- 
.'. ble ¿ por un conjunto cualquiera de observables que conmutan E,, E, ... En, 
: pues para la demostración basta introducir algunos cambios formales. 


| rta ill IPS PO <P 
- 20. Nuevas formas de notación A 
> ! 


La teoría de representaciones que hemos desarrollado nos proporciona 
un procedimiento general para ie a los kets y a los bras. En una 
representación en que el conjunto | ompleto de observables ÉE,, ..., E, sean 
diagonales, un ket |P> cualquierg tendrá por representante AS [P>, 

_ que para abreviar escribiremos <5'|P>. Este representante es una función 
definida de las variables E”, que llamaremos y4(8'). Así pues, la función ys 


determina completamente el ket |P>, y puede ser utilizada para designar 
a dicho ket en lugar de emplear el índice contrario P. Simbólicamente, si 


ió =848) UN 1 
escribiremos K (60) 
y AP) = E) 74) 


ar 


y rn 


Hemos de escribit. igual a [y(E)> y no a W(8”)>, ya que no depende de . 
E ACE IS 


Ñ 
gar AI A 
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un conjunto particular de autovalores dé los E sino sólo de la forma de la 


función +, | | 
Si f(E) es una función cualquiera de los observables 8,, ..., E, el ket 
F(E)1P> tendrá como representante 


<ENNE)P> =(E)4(E7). 
Y, por tanto, según (60), escribiremos 


FEJP> =11(E)/4(E)>. 


Utilizando la segunda de las ecuaciones (60), esto equivale a 


RENE) = 11(E)4(8)>. (61) 


Este resultado es general, y es válido para cualesquiera f y y funciones 
de £. De ahí que en la nueva notación, la línea vertical | no sea ya necesaria, 
y ambos miembros de (61) los podemos escribir simplemente f(E)p(8)>. 
Así la regla de la nueva notación. será la siguiente: | 


S1 
<P> = (E) TS 
escribiremos t (62) 


[P> = (E )> AAN 


Incluso podremos abreviar (8) por y y sobreentender las variables E siem- 
pre que ello no dé lugar a confusión. 


El ket_4(8)> puede nsiderado como el resultado de aplicar el 'y" 
operador a un ket que s ¡be simpleme , Sin índice ninguno. ef 
et > le llamaremos koi standard. Todo ket puede expresarse como el | 


producto de una función de las E por el ket standard. Por ejemplo, si en (62) 


tomamos como |P> el ket básico |5”>, obtendremos ¿ Ñ y 


18% =38b, 07 IA E E): (8, —E7)> (63) 


donde suponemos que los És, ..., E, tienen autovalores discretos y los 
Eo+1, .-»» Eu los tienen continuos. El ket standard se caracteriza por la condi- 
ción de que su representante <E”> es igual a uno para todo el dominio de 
las variables £”, según puede verse haciendo y = 1 en (62). 

Aún podemos abreviar más nuestra notación suprimiendo el símbolo > 
y sobreentendiendo el ket standard. En este caso, el ket se designa simple- 
mente 4(%), como una función de los observables E. Una función de las E 


usada de este modo para caracterizar un ket se denomina función de onda. * 
El sistema de notación que emplea funciones de onda es el que acostumbran 


e Este nombre se debe a que en los primeros tiempos de la mecánica cuántica 
todos los ejemplos que aparecían de esas funciones eran de forma ondulatoria. Pero 
desde el punto de vista de la moderna teoría general, dicho nombre no resulta ya 
descriptivo. 


Y (3) > MUDA fe de Oda 
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a utilizar la mayoría de los autores en los cálculos de mecánica cuántica. 
- Cuando lo usemos habremos de recordar que junto a cada función de 
onda se sobreentiende siempre un ket standard que la multiplica a su dere- 
cha, que nos prohíbe multiplicarla por un operador a su derecha. Las fun- 


3 ciones de onda sólo se pueden multiplicar por operadores a la izquierda. á 
| Esto las distin as funci inarias, que son operadores y pueden 


multiplicarse por otros operadores tanto a la izquierda como a la derecha. 


Una función de onda es precisamente el representante de un ket. do 

como función de los observables £ en vez_de los autovalores E' de dichos 

observables. El cuadrado de su módulo da la probabilidad (o la probabE 

lidad relativa si no está normalizado) de que, para el estado correspon- “> 

diente, los E tengan valores dados o estén comprendidos en pequeños | 

intervalos dados. YE a prada A bro, ES die 
Para los bras se puede desarrollar la nueva notación del mismo modo A 

> 


que para los kets. Un bra <Q] cuyo representante <Ql5'> sea p(8”, lo es- 
cribiremos <¿(5)|. Con esta notación, el imaginario conjugado de |y(8)> 

es <4(8)|. Por tanto, la regla que hemos empleado hasta ahora según la cual 
designábamos un ket y su bra imaginario conjugado los dos con el mismo 
índice, habremos de generalizarla de este modo: si para designar un ket 

se emplean números o funciones complejas, para designar su bra imaginario 
conjugado se habrán de emplear los números o funciones complejos conju- 

gados. Como en el caso de los kets, podemos comprobar que <HAENAE) y 
<p(E)f(E) representan el mismo bra y que, en consecuencia, la línea vertical 

puede omitirse. Podemos considerar <p(%) como el producto del operador 

lineal $() por el bra standard <, que es el imaginario conjugado del ket ' | 
standard > Podremos dejar sobreentendido el bra standard, y así un bra 
general se escribirá ¿(8); que es el complejo conjugado de una función de 2 YE 
onda. El complejo conjugado de una función de onda puede ser multi- | 
plicado por un operador lineal a la derecha, pero nunca por la izquierda. 
podemos construir productos triples de la forma <f(E)>. Un producto 

triple de esta forma es un número igual a la suma o la integral de [(8) 

para todo el dominio de autovalores de los E, o sea 


«e» = Y f..f 16) az, ...ae (84) 
| t1..£o 


para el caso en que los é,, ..., E, tengan autovalores discretos, y los Ep»1, 
..., E, tengan autovalores continuos. 

Tanto el ket como el bra standard se definen siempre respecto a una 
representación. Si repitiéramos las consideraciones anteriores con una repre- 
sentación diferente en la que el conjunto completo de observables que es y 
diagonal fuera 1, o si cambiamos simplemente los factores de fase de la | 
representación en la que los E son diagonales, obtendríamos un bra y un 
ket standard diferentes de los anteriores. Cuando trabajemos a la vez con 
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varios kets o bras standards diferentes habrá que distinguirlos mediante 
índices convenientes. E 
Vamos a discutir ahora un nuevo desarrollo de nuestra notación de gran 
importancia para tratar sistemas dinámicos complicados. Sea un sistema Ñ es 
dinámico que puede describirse en función de ciertas variables dinámicas | 
susceptibles de clasificarse en dos conjuntos — conjunto Á y conjunto B— .¿,P 
tales que cualquier elemento de A conmuta con cualquier elemento de B. ' 


depende a la vez de as var : s B. Consideremos otro 
sistema dinámico "cuyas únicas variables dinámicas sean las variables Á y 
llamémosle sistema A. Y análogamente consideremos un tercer sistema 
en dinámico, el sistema B, cuyas únicas variables dinámicas sean las varia- 
ES bles B. El sistema original puede considerarse como una combinación de 
los sistemas A y B según un esquema matemático que damos a continuación. 
Sea la> un ket cualquiera del sistema A y |b> un ket cualquiera del sis- 
tema B. Establezcamos un producto |a>|b> que disfrute de las propiedades 
conmutativa y distributiva de la multiplicación: 1) 
a bo. 
la>¡b> = |b>|a>, Ñ 
tcila1> +czlaz>31b> = c1]a1>|b>4-c2laz>1b>, 
ja> £c1]b1>+-cejb2>) = cila> |b1>+c2la>|b3>, 


siendo las c números cualesquiera. Para cada variable A podemos definir 
. su acción sobre el producto ja>[b> estableciendo que actúa sólo sobre el 
<. factor ja» y conmuta con el factor |b>. Análogamente podemos definir la 
| acción de cada variable B sobre el producto estableciendo que opera sólo 
sobre el factor |b> y conmuta con el ja>. (Lo que.hace que toda variable A 
-'conmute con toda variable B.) De este modo cada variable del sistema origi- 
nal puede operar sobre el producto |a>|b>, de forma que este producto 
puede escribirse lab>, pues los dos índices a y b son suficientes para espe- 

cificarlo. De este modo obtenemos las ecuaciones fundamentales 


la>ib> = Ib>ja> = jab>. (65) 


Esta multiplicación es de un tipo diferente a todas las que hemos uti- 
lizado hasta aquí en la teoría. Los vectores ket ja> y ¡b> están en dos espa- 
cios vectoriales diferentes, y su producto está en un tercer espacio vectorial, 
que podemos llamar producto de los espacios vectoriales, El número de 
dimensiones del espacio producto es igual al producto de los números 
de dimensiones de los espacios factores. Un vector ket del espacio producto 
no es en general de la forma (65), sino una suma o integral de kets de esta 
forma. 

Consideremos una representación del sistema A en la que sean diago- 
nales un conjunto completo de observables que conmutan £4. Tendremos 

. así para el sistema A los bras básicos <E”,1. Análogamente, en una represen- 
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tación del sistema B en la que los observables Es son diagonales, tendre- 
mos para el sistema B los bras básicos <E”_|. Los productos 


KE 1=<E E (86) 


nos proporcionarán los bras básicos de una representación del sistema 
original en la que todos los £4 y Es serán diagonales. Los E4 y Es juntos 
formarán un conjunto completo de observables que conmutan para el 
sistema original. A partir de (65) y (66) resulta 


<E la><E" lb> =<8! E ab», (67) 


lo que nos muestra que el representante de |ab> es igual al producto de 
los representantes de |a> y |b> en sus respectivas representaciones. 

Podemos introducir el ket standard >4 correspondiente al sistema Á y a 
la representación en que los £4 son diagonales, y asimismo el ket stan- 
dard >» correspondiente al sistema B y a la representación en que los Ex 
son diagonales. Su producto >1>» es entonces el ket standard correspon- 
diente al sistema original y a la representación en que los E4 y los Ex son 
diagonales. Un ket cualquiera del sistema original se puede expresar 
en la forma | 


v(E1E8)>4>B- (68) 


Pudiera ocurrir que en ciertos cálculos nos interese emplear una repre- 
sentación particular del sistema B — por ejemplo la representación anterior 
en la que los Ez son diagonales —pero que en cambio no nos interesa 
introducir ninguna representación particular del sistema A. Nos convendrá 
entonces usar el ket standard >» del sistema B y no introducir ningún ket 
standard del sistema A. En este caso todo ket del sistema original podremos 
escribirlo en la forma 


|Ea>>5, (69) 


donde |£»> es un ket del sistema Á y es además función de los E; es decir, 
es un ket del sistema A para cada conjunto de valores de los £s. De hecho 
(69) es igual a (68) si hacemos | 


lEs> =Y4(E4Én)>a- 


En (69) podemos dejar sobreentendido el ket standard >», y entonces el ket 
general del sistema original nos aparece en la forma |Ex>, que es un ket 
del sistema A y una función de onda de las variables Es del sistema B. 
En $$ 66 y 79 hay ejemplos de esta notación. 

Las consideraciones anteriores las podemos generalizar inmediatamente 
a un sistema dinámico que pueda describirse en función de variables diná- 
mica susceptibles de clasificarse en tres o más conjuntos A, B, C, ... tales 


E 
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E | que cualquier elemento de un conjunto conmuta con cualquier elemento 
2. de otro. La generalización de la ecuación (65) será 


mea E la>lbolo>...=abc...», 39% 


yo donde los factores del primer miembro son kets de los sistemas compo- /-* 
A nentes, y el ket del segundo miembro es un ket del sistema original. De un 
- modo semejante se pueden generalizar para este caso de varios factores las 
"ecuaciones (66), (67) y (68). 


IV 


CONDICIONES CUAÁNTICAS 


21. Corchetes de Poisson 


Hasta aquí nuestra labor ha consistido en construir un esquema mate- 
mático general que relaciona los estados y los observables en mecánica 
cuántica. Uno de los rasgos más característicos de este esquema es que en 
él los observables y las variables dinámicas en general son cantidades que 
no disfrutan de la propiedad conmutativa de la multiplicación. Ahora será 
necesario establecer ecuaciones que nos den el valor de £n—né para obser- 
vables o variables dinámicas £ y y cualesquiera, que sustituyan a la propie- 
dad conmutativa de la multiplicación. Hasta que no conozcamos dichas 
ecuaciones no tendremos un esquema mecánico completo que pueda susti- 
tuir a la mecánica clásica. Estas nuevas ecuaciones reciben el nombre de 
condiciones cuánticas o relaciones de conmutación. 

El problema de hallar condiciones cuánticas no tiene un carácter tan 
general como los que hemos considerado hasta ahora. Se trata de un pro- 
blema que se nos presenta en particular cada vez que estudiamos un sistema 
dinámico concreto. Sin embargo, existe un método muy general para obte- 
ner condiciones cuánticas que se puede aplicar a una gran cantidad de 
sistemas dinámicos. Es el método de analogía clásica, que constituye el 
objeto de este capítulo. Los sistemas dinámicos a los que no se pueda 
aplicar dicho método deberemos estudiarlos individualmente y en cada caso 
tendremos que hacer consideraciones especiales. 

La validez de la analogía clásica en el desarrollo de la mecánica cuán- 
tica proviene del hecho de que la mecánica clásica da una descripción 
correcta de los sistemas dinámicos en ciertas condiciones, a saber, cuando 
las partículas y los cuerpos que constituyen el sistema son suficientemente 
grandes para que la alteración que acompaña a la observación sea despre- 
ciable. Por tanto, la mecánica clásica tiene que ser un caso límite de la] Í 
cuántica y, en consecuencia, debemos esperar que a conceptos importantes - 
en mecánica clásica correspondan conceptos importantes en mecánica cuán- 
tica, y que tras un análisis de la naturaleza general de la analogía entre la 
mecánica clásica y la cuántica ha de ser posible deducir leyes y teoremas 


96 CONDICIONES CUÁNTICAS 


de esta última que sean simples generalizaciones de resultados bien cono- 
cidos en la teoría clásica. En particular, podremos obtener las condiciones 
cuánticas como simples generalizaciones de la ley clásica según la cual 
todas las variables dinámicas conmutan. 

Sea un sistema dinámico constituido por un conjunto de partículas en 
interacción. Para estudiar dicho sistema, podríamos tomar como variables 
dinámicas independientes las coordenadas cartesianas de cada partícula y 
las correspondientes componentes cartesianas de las velocidades. Pero es 
preferible utilizar las componentes del momento en lugar de las de la 
velocidad. Llamemos q, a las coordenadas (r toma todos los valores desde 1 
hasta tres veces el número total de partículas) y p, a las correspondientes 
componentes del momento. Se dice que las q, y las p, son coordenadas c ca- 
nónicas conjugadas. cdi 

El método de las ecuaciones del movimiento de Lagrange permite in- 
troducir coordenadas q, y momentos p, de un modo más general, que tam- 
bién se puede aplicar a sistemas que no estén compuestos por partículas 
(por ejemplo, un sistema que contenga cuerpos rígidos). A dichas q, y pr 
más generales también se les llama coordenadas canónicas conjugadas. 
Toda variable dinámica se puede expresar como función de un conjunto de 
coordenadas canónicas cualesquiera. 

En la teoría dinámica general es importante el concepto de corchete de 
Poisson. Todo par de variables dinámicas u y v tienen un P.B. (Poisson 
Bracket, o en castellano corchete de Poisson), que designaremos [u, o], 


definido por 
óu 060 0u 00 
A ? e 1 
Lu, ol : | 041 Opt Op, 0qr | $ 


En la fórmula, a efectos de derivación, se consideran u y v expresadas en 
función de un conjunto de coordenadas canónicas q, y pr. El segundo miem- 
bro de (1) es independiente del conjunto de coordenadas canónicas que 
sirve de referencia, como se desprende de la definición general de coorde- 
nadas canónicas; luego el P.B. [u, v] está bien definido. 

Las principales propiedades de los corchetes de Poisson, que se dedu- 
cen inmediatamente a partir de la definición (1) son 


[u, v] = —[o, ul, . (2) 
[u, e] =0, (3) 


en donde c es un número (que se puede considerar como un caso particu- 
lar de variable dinámica). 


[u,+u>, v] + [u,, 0]+[us, v], 


[u, 0, +02] —= [u, 0,]4+[u, vel, (4) 
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[u, uz, 0] = ya 24» q» Pp, pr pr qe 
= [u,, 0]uz +41 [u2, 01, 1 (5) 
[ts, Ús 02) == [u, 01,]v2+0,[u, va]. ' 
Asimismo se puede comprobar fácilmente la identidad a 
| [u, [o, 0]] + [o, [t0,4]] + [w, [u,0J] =0 “* (6) 


Las ecuaciones (4) indican que el P.B. [u, 1] contiene a u y v linealmente, 
mientras que la (5) corresponde a las leyes ordinarias de derivación de un 
producto. 

Intentemos introducir un P.B. en mecánica cuántica que tenga propie- 
dades análogas al de la teoría clásica, Supondremos que el P.B. cuántico 
satisface todas las condiciones (1) a (6), pero teniendo en cuenta que ahora 
es necesario conservar el orden de los factores 4, y uz en la primera de las 
ecuaciones (5) tal como lo hemos escrito aquí, y lo mismo con las 0, y 02 
de la segunda ecuación (5). Estas condiciones son suficientes para determinar 
univocamente la forma del P.B. en mecánica cuántica, como resulta del 
siguiente argumento. Podemos calcular el P.B. [u, us, 0, 09] mediante dos 
procedimientos, según cual de las dos fórmulas (5) empleemos primero. 
Luego, | 
[41 42,01 02] = [u,, 0, 02]Juz+4,[u9, 0, 02] 

= ([u,, 0,]02+0,[4,, 02])u24-4,([u2, 0,]024+01[u2, 02]) 
= [u,, 01]02 uz-+-0,[41, 02 ]uz+-41[u2, 0,1024 01[u2, 02] 
y 
[u, us, 0,02] = [u, 42, 01]02 4-0, [41 9, Va] 
= [u,, 01,]uz 0,+41[u2, 0,]024+01[41, 02]us +0, 41 [42, 02]. 


Igualando ambos resultados obtenemos 
[us, 01](u2 V3—02 UU) = (te 0, —01 ur) [uz, 02]. 


Como estos resultados tienen que verificarse para variables 4, y 04 com- 
pletamente independientes de las uz y vz, debe verificarse 


4, 0, —0, 4, = iA[u,, 0,], 
12 02 — 02 Us = ifi[uz, 02], 


en donde % no puede depender ni de u, y 0,, ni de uz y 0», y tiene que 
conmutar con (u, 0, — 01 41). Luego A tiene que ser un número. Si quere- 
mos que, como ocurre en la teoría clásica, el P.B. de dos variables dinámi- 
cas reales sea real, según el final de la pág. 40, es necesario que Ah intro- 
ducido así, con el coeficiente i, sea real. Llegamos así a la siguiente 
definición cuántica del P.B. [u, v] de dos variables u y v cualesquiera: 


uv —vu — if[u, o], (7) 


7. — CUÁNTICA a e e 


98 CONDICIONES CUÁNTICAS 


en la que h es una nueva constante universal que tiene las dimensiones de 
acción. Para que la teoría esté de acuerdo con la realidad experimental 
tenemos que elegir A igual a h/2r, siendo h la constante universal introdu- 
cida por Planck, conocida con el nombre de constante de Planck. Puede 
comprobarse fácilmente que el P.B. de la mecánica cuántica verifica todas 
las condiciones (2), (3), (4), (5) y (6). 

Con esto, el problema de hallar condiciones cuánticas se reduce a deter- 
minar los valores de los P.B. de la mecánica cuántica. La gran analogía 
que hay entre el P.B. de la mecánica cuántica definido por (7) y el P.B. 
de la mecánica clásica definido por (1) nos lleva a formular la hipótesis 
de que los P.B. de la primera, o por lo menos los más sencillos, tienen el 
mismo valor que los P.B. correspondientes de la mecánica clásica. Los P.B. 
más sencillos son los relativos a las propias variables canónicas, que en la 
teoría clásica tienen los siguientes valores: 


[qr, 9.) —= O, [p+, Pa] _— O, E 
O 8 
[qr, pe] = Sra. y de (6) 


Así supondremos que los P.B. correspondientes de la mecánica cuántica 
tienen también los valores dados por (8). Eliminando dichos P.B. con ayuda 
de (7), obtendremos las ecuaciones. | 


r— Ga gr = 0, Prpo—Popr=0, 0 > | (0) 
Gr Ps — Ps Qr = iR8re, IN ; 





que son las condiciones cuánticas fundamentales, que como vemos nos dan 
las relaciones de conmutación entre coordenadas canónicas conjugadas. 
A su vez, estas ecuaciones constituyen la base para calcular relaciones de 
conmutación entre otras variables dinámicas. Por ejemplo, si £ y y son dos 
funciones de las q, y de las p, que se pueden desarrollar en serie de poten- 
cias, podemos expresar En — 18 o [E, 1] en función de los P.B. fundamen- 
tales (8), aplicando reiteradamente las leyes (2), (3), (4) y (5), y calcular 
así dichas expresiones. En los casos sencillos el resultado es con frecuencia 
el mismo que el que se obtiene en la teoría clásica o bien difiere de él en 
que exige que los diversos factores de un producto estén en un orden dado, 
cosa que evidentemente desde el punto de vista clásico no tiene importan- 
cia. Incluso cuando E y «y sean funciones más generales de q, y de p, 
no desarrollables en serie de potencias, las ecuaciones (9) siguen siendo 
suficientes para determinar el valor de £n —n£ como veremos más ade- 
lante. Por tanto, las ecuaciones (9) son la solución al problema de hallar 
las condiciones cuánticas para todos los sistemas que tengan una imagen 
clásica y que se puedan describir mediante variables canónicas. Sin em- 
bargo, esto no abarca todos los sistemas, de la mecánica cuántica. Las 
ecuaciones (7) y (9) constituyen la base de la analogía entre la mecánica 
cuántica y la mecánica clásica. En ellas vemos que la mecánica clásica 
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puede ser considerada como un caso límite de la cuántica cuando h tiende 
a cero. Un P.B. en mecánica cuántica es una noción puramente algebraica 
y, en consecuencia, es un concepto más importante que en la teoría clásica, 
donde sólo se puede definir en relación a un conjunto de coordenadas 
canónicas. Por este motivo las coordenadas canónicas son menos impor- 
tantes en mecánica cuántica que en la clásica; de hecho podemos tener 
un sis cuántico para el que no existan coordenadas canónicas y en el 
que, sin embargo, sigan teniendo sentido los-P:B, Tal sistema no tendría 
imagen clásica, y por lo tanto no podríamos obtener sus condiciones cuán- 
ticas por el método que hemos indicado. 

Según las ecuaciones (9) vemos que todo par de variables con distintos 
subíndices r y $ conmutan siempre. De aquí se sigue que cualquier función 
de q» y p- conmuta con toda función de q, y Ps siempre que s sea distinto 
de r. Distintos valores de r corresponden a distintos grados de libertad del 
sistema, luego las variables dinámicas que hacen referencia a grados de 
libertad distintos conmutan. Esta ley la hemos deducido de (9), y por tanto 
sólo la hemos demostrado para aquellos sistemas que tengan imagen clásica, 
pero supondremos que es válida en general. Así ya tenemos un procedi- 
miento para hallar las primeras condiciones cuánticas de sistemas para los 
que, aunque no existan coordenadas canónicas, tenga sentido hablar de 
distintos grados de libertad, cosa que podremos hacer con la interpretación 
física del problema. 

Ahora podemos ver cuál es el significado físico de la división de las 
variables dinámicas estudiada en la sección anterior, en conjuntos tales que 
cualquier elemento de un conjunto conmuta con cualquier elemento de los 
otros conjuntos. A la luz de lo dicho, cada conjunto corresponde a un cierto 
número de grados de libertad, o quizás a uno sólo. Dicha división puede 
coincidir con el proceso físico de separar el sistema dinámico en sus partes 

- constituyentes, cada una de las cuales puede tener existencia por sí sola 
como un sistema físico aislado, y que puestas todas ellas en interacción 
dan lugar al sistema original. Pero puede ser un simple artificio matemático 
para separar el sistema dinámico en grados de libertad que físicamente no 
se pueden separar; por ejemplo, un sistema constituido por una partícula 
con estructura interna se puede separar en los grados de libertad que des- 
criben el movimiento del centro de la partícula y los que describen la 
estructura interna. 
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Consideremos un sistema dinámico con n grados de libertad que tenga - 
una imagen clásica, y que por lo tanto se pueda describir mediante varia- 
bles canónicas Qqr, Pr (r=1, 2, ..., n). Supondremos que las coordenadas 
q, son todas observables y que tienen un espectro continuo de autovalores, 
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lo que está justificado teniendo en cuenta el significado físico de la q?. 
Sea una representación en la que las q, sean diagonales. El problema con- 
siste en saber si las q, constituyen un conjunto completo de observables 
que conmutan para dicho sistema. Parece bastante natural que así sea. 
Por ahora lo supondremos así, y lo justificaremos más tarde (véase el ti- 
nal de la pág. 102). La representación en la que las q, constituyen un 
conjunto completo de observables que conmutan queda completamente 
determinada a excepción de los factores de fase arbitrarios. 

Consideremos en primer lugar el caso n= 1 para el que no exista más 
que una q y una p. Tendremos 


ap — pq =ih. (10) 


Todo ket se puede escribir en la representación del ket standard como 
b(q)>. A partir de él podemos construir otro ket dy4:/dg>, cuyo represen- 
tante es igual a la derivada del representante del ket de partida. El ket así 
obtenido es función lineal del ket de partida y por tanto es el resultado 
de aplicar un operador lineal a dicho ket. Llamando d/dg a dicho operador, 
tenemos 
d del: 
E —+b> = —. (11) 
dq dq 
La ecuación (11), válida para toda función y define el operador d/dq. 
Tenemos II e 
4 j Jo Sto e he AS 
dq ] 


Consideremos el operador lineal d/dq según la teoría general de ope- 
radores lineales dada en $ 7. Según ella podemos aplicarlo a un bra <¿(q), 
y su producto <$d/dq definido en (3) de $ 7 vale 


d | y q | | 
<$b=T ¡> =<b | — E) 13 

| dq Ne lag” ds 
para toda función (q). Tomando representantes resulta 


¡REG 14 
da (14) 


Podemos transformar el segundo miembro integrando por partes, y así 
obtenemos 


d , , NN 
f a da w(q) = 


d 
/ raid dq! p(q) = j pq) dq" —— 


(15) 





si la contribución en los límites de integración es nula. Resulta pues 


92, REPRESENTACIÓN DE SCHRODINGER 101 


dl de(q 
GE Pg”) 


O 
dq dq 
lo que demuestra que 
d de 
ar == o (16) 


Luego, d/dq aplicado por la izquierda a la función compleja conjugada de 
una función de onda representa derivar respecto a q y cambiar de signo. 

La validez de esta conclusión depende de la posibilidad de que sea 
posible pasar de (14) a (15), y, por tanto, debemos limitarnos a considerar 
bras y kets quecorrespondan a funciones de onda que satisfagan unas con- 
diciones de contorno adecuadas. La condición que se aplica en la práctica 
es que se-amulen en los límites. (En la próxima sección se darán unas con- 
diciones algo más generales.) Tales condiciones no sólo no limitan la apli- 
cabilidad de la teoría sino que por el contrario son también necesarias 
frecuentemente desde el punto de vista físico. Por ejemplo, si q es una 
coordenada cartesiana de una partícula, sus autovalores van desde —oo 
a oo, y si exigimos que la partícula tenga probabilidad nula de estar en el 
infinito llegamos a la condición de que la función de onda debe anularse 
para q==t0, 

Podemos calcular el complejo conjugado del operador lineal d/dq te- 
niendo en cuenta que el imaginario conjugado de d/dq-Yp> o dy:/dq> 
es <di/dq, o sea —<Hd/dq según lo visto en (16). Luego, el complejo con- 
jugado de d/dq es — d/dq y, por tanto, d/dq es un operador lineal imagi- 
nario puro. 

Para calcular el representante de d/dq tengamos presente que apli- 

cando la fórmula (63) de $ 20, se tiene 


lg> = 8(q — q”)>, (17) 
de modo que | 
Po = ÁÚl— (18) 
“da A dq d —( )?, d 
y por tanto, e | 
< | d lg d Sl , 50) (19) 
Pl ==> A 
dq dq 


El representante de d/dq lleva consigo la derivada de la función 3. 
Vamos a calcular la relación de conmutación entre d/dq y q. Tenemos 
d d 
¿a 


——qU) = da 


d 
dq = q rd +). (20) 


Puesto que esta ecuación es válida para todo ket y>, resulta 
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d d 
AS (21) 
OT 


Comparando este resultado con (10) vemos que la relación de conmutación 
entre —ih d/dq y q es la misma que entre p y q. 

Para generalizar estos resultados al caso de un n cualquiera, designamos 
el ket general y(q1...qn)> = 4> e introducimos n operadores lineales 9/0q+ 





(r = 1,..., n), que pueden actuar sobre dicho ket según la regla 
O ob 
— br = —>, 22 
a => (22) 
que corresponde a (11). La ecuación análoga a (12) es 
O 
0 (23) 
09r 


Si nos limitamos a considerar bras y kets que correspondan a funciones de 
onda que satisfacen condiciones de contorno adecuadas, estos operadores 
lineales pueden actuar también sobre bras según la regla 


E) 09 
A A EA 24 
EA NT (24) 


que corresponde a (16). Por tanto, 2/0q, se puede aplicar por la izquierda 
a la función compleja conjugada de una función de onda con el significado 
de derivación respecto de q, más cambio de signo. Igual que antes, resulta 
que cada uno de los operadores 9/2q, es un operador lineal imaginario puro. 
En correspondencia con (21) resultan las relaciones de conmutación 





O O 
—— Ue — Ya > — rg: 
ar 7 (25) 
Tenemos además 
a) O OY O 1) 
04r 0s 0109. Os 0Qr d ye) 
de donde se deduce 
ls) O O O 


0qr 0% 0% 09. (27) 
Comparando (25) y (27) con (9), vemos que las relaciones de conmutación 
entre los operadores lineales —iñ 9/0q, y los q, son las mismas que entre 
los p, y los Qs. 

Podríamos tomar 





p. = —iñ 0/0q» (28) 
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sin dar lugar a ninguna contradicción. Tal posibilidad nos muestra que las 
q» constituyen un conjunto completo de observables que conmutan, pues 
permite expresar toda función de las q, y de las p» como función de las 
qr y de las —iñ 09/0q, y dicha función no conmutaría con todas las q, a . 
menos que fuera función únicamente de las q,. 

Las ecuaciones (28) no tienen que ser válidas necesariamente. Pero, en 
cualquier caso, cada una de las cantidades pr +A 0/0q- conmuta con 
todas las q, y, por tanto, según el teorema 2 de $ 19, es una función de 


las Gs. Luego, 
p, = —ihñ 0/0q» + f+(q). (29) 


Como p, y —ih.0/0q, son reales, f.(q) también ha de serlo. Para toda fun- 
ción f de las q tenemos 


O (2) 
E = Faq? + o» 
O sea, , E P” | 
El a] a (30) 
Con ayuda de (29) podemos deducir la fórmula general 
pH —fp, = —ih 0f/0q». (31) 
Esta ecuación se puede escribir en notación de P.B. 
[f, pr] = 0f/0q», (32) 


que es la misma ecuación que se deduce en la teoría clásica a partir de (1). 
Multiplicando (27) por (—ih)? y sustituyendo —ih 0/0q, y —ifñ 0/0q. poz 
sus valores dados por (29), resulta 


(Pr — fps — fo) = (Ps — fa pr — 17), 


que con ayuda de la condición cuántica p,P, = P»p» se reduce a 


prÍ, + f.Ps — =p» + Pr. 


Esta puede a su vez simplificarse mediante la (31) 


Ofs/0q» = Ofr/0q,, (33) 
que nos dice que todas las funciones f, son de la forma 
f, = 0F/0q» (34) 
donde F es independiente de r. Así la ecuación (29) queda en la forma 
p. = —ih 0/0q, + 0F/0qr. (35) 


Hasta aquí hemos estado trabajando en una representación que fijamos 
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mediante la condición de que en ella las q, sean diagonales, pero que 
podía contener factores de fase arbitrarios. Si cambiamos los factores de 
fase cambiarán también los operadores 9/0q,. Vamos a demostrar ahora que 
eligiendo convenientemente los factores de fase puede hacerse nula la fun- 
ción F de (35), con lo cual serán válidas las ecuaciones (28). 

Emplearemos asteriscos para señalar las cantidades que están expresa- 
das en la nueva representación con los nuevos factores de fase. Los nuevos 

bras básicos estarán relacionados con los anteriores por 


<q = er<g”...q.| | (36) 


donde y” = y(q”) es una función real de las q”. El representante de un 
ket en la nueva representanción será igual al anterior multiplicado por e*”, 
y por tanto e'Yy>* = y)», de donde se deduce 


ye — em (37) 


que es la relación entre el ket standard de la nueva representación y el de 
la de partida. El nuevo operador lineal (0/0q,)? verificará la ecuación análo- 


ga a la (22) 
ON Wo 
(ar) » a A 


habiendo empleado (37) para la segunda igualdad. De ella, con ayuda 
de (22) resulta 











a y? B) E) 
(E) dr) A A Ad 


luego, 


e”, (38) 





o 
sl = et 


0Qr 0Qr 


o y? 17) OY 
e METE e 

Si elegimos y de modo que 
F — hy + constante, (40) 


y mediante (30) 





la (35) se reduce a 
p, = —ih(0/0q,)”. (41) 


La ecuación (40) nos determina y a menos de una constante de fase arbi- 
traria, con lo que la representación queda así determinada a menos de un 
factor de fase constante. 

En consecuencia, es posible elegir una representación donde las q, sean 
diagonales y en la que sean válidas las ecuaciones (28). Esta representación 
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tiene gran utilidad para muchos problemas. La llamaremos representación 
de Schródinger, pues fue la representación que empleó Schródinger cuando 
en 1926 dio su formulación original de la mecánica cuántica. La represen- 
tación de Schródinger existe siempre que existan coordenadas canónicas 
Qr y Pr, y está perfectamente determinada a menos de un factor de fase 
arbitrario constante. Su gran ventaja consiste en que nos permite expresar 
inmediatamente toda función algebraica de las q, y de las p, que sea 
desarrollable en serie de potencias respecto a las p, como un operador de 
derivación, es decir, si f(Q1, ..., Gn» Pi -»»» Pn) es la función en cuestión, 
podemos escribir 


f(Q1) -»-> Gus Pis ===» Pn) = F(Q1) «+0» Qu, —ih 0/0q1, ...,—1ñ 0/0n), (42) 
conservando el orden de los factores en los productos al sustituir las p, por 
—ih0/09+. 

De (23) y (28) resulta 


Luego el ket standard de la representación de Schródinger se caracteriza 
por ser un autoket común a todos los momentos perteneciente a los auto- 
valores cero. Podemos considerar otras propiedades de los vectores básicos 
de la representación de Schródinger. La ecuación (22) da: 


d os ab(gr-- q) 
Ag = Al = —— 


— 


” 09, 04, 


7 0 <q” Pe 
a EA 4,9, 4 


Luego, 
12) O 
lt = — 4 91, 44 
Ae A a (44) 
y por tanto, 
O 


r 


Análogamente, la ecuación (24) nos lleva a 


, a s 19) ? , 
PI q? = rra ri (46) 
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23. La representación de momentos 


Sea un sistema de un sólo grado de libertad, que se pueda describir 
_mediante una q y una p siendo el espectro de autovalores de la q el con- 
junto de todos los números desde —«o hasta +00, y consideremos un 
autoket [p”> de p. Su representante <q"[p'> en la representación de Schró- 
dinger verificará 


d 
p <q ip> = <qlpip> = ra <q p>, 
como resulta de aplicar (45) para el caso de un sólo grado de libertad. 
La solución de esta ecuación diferencial en <q'|p”> es 


<q lp> = Cercs, (47) 


siendo c” — c(p”) independiente de q”, pero pudiendo depender de p”. 

El representante <q'|p”> no verifica la condición de contorno de anularse 
para q! = +00. Esto lleva consigo ciertas dificultades, que se ponen clara- 
mente de manifiesto al no cumplirse el teorema de ortogonalidad. Si consi- 
deramos otro autoket |p””> de p de representante 


q) =0 ere, 


que pertenezca a un autovalor p” distinto, resultará 


00 es) 
<pp> = j <p lg > dq! <qlp"> = ce” j eur mv/h da”, (48) 

—o0 — 0% 
Esta integral no converge en el sentido de la definición habitual de conver- 
“gencia. Para que la teoría sea coherente, adoptamos una nueva definición 
de convergencia para las integrales cuyo dominio de integración se extienda 
a infinito, análoga a la definición de Cesáro para la suma de series infinitas. 
Con la nueva definición, una integral que en el límite superior se comporte 
como cos ag” o sen aq”, siendo a un número real distinto de cero, se dice 
que no contribuye al valor de la integral en dicho límite, es decir, se toma 
el valor medio de las oscilaciones. Y análogamente para el límite inferior 
cuando q” tiende a menos infinito. Con esta definición, el segundo miembro 
de (48) se anula para p” 4 p', y el teorema de ortogonalidad sigue cum- 
pliéndose. Asimismo son iguales los segundos miembros de (13) y (14) 
cuando <p y > son autovectores de p, con lo cual el operador d/dq se 
puede aplicar a los autovectores de p. Luego, las condiciones de contorno 
que han de verificar los representantes de los bras y de los kets que tienen 
sentido se puede generalizar exigiendo tan sólo que cuando g” tiende a 
más o menos infinito, el representante se comporte como cos ag” o sen ag”. 
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Cuando p” se aproxima a p”, el segundo miembro de (48) se convierte 
en una función $. Para calcularlo necesitamos la fórmula 


f es dx = 25 32) (49) 
- o 
que es válida para a real, como vamos a demostrar a continuación. Para a 
distinto de cero los dos miembros son nulos, y la fórmula evidentemente es 
correcta, Además, para toda función continua f(a) cuando g tiende a infi- 
nito, se tiene 


f f(a) da j cda == bo da 2a”* sen ag = 2xf(0) 


— 00 - 8 


Puede darse un argumento más complicado para demostrar que se llega 
al mismo resultado tomando en lugar de g y —£, los límites g1 y —-82 que 
tiendan a infinito de modo distinto (aunque no completamente distinto). 
Esto nos demuestra la equivalencia de los dos miembros de (49) cuando 
los utilizamos como factores bajo el signo integral, quedando así demostrada 
la fórmula. 

Teniendo en cuenta (49), la (48) se convierte en 


<p |p”> — EC" 2 8[(p' _ p)/%] — ¿ch 3(p' _ p””) 
= (Php —p). (50) 


Hemos obtenido un autoket de p para cada autovalor real p”, y su repre- 
sentante viene dado por (47). Todo ket |X> se puede expresar en función 
de dichos autokets de p, pues su representante <q'/X> se puede desarrollar 
en serie de los representantes (47) utilizando el análisis de Fourier. Por 
tanto, el momento p es un observable, de acuerdo con el resultado experi- 
mental de que los momentos se pueden observar. 

Así aparece una simetría entre q y p. Ambos son observables cuyos 
autovalores van desde —o« a +00, y la relación de conmutación entre 
ellos (10), no cambia si intercambiamos q con p y sustituimos i por —4. 
Hemos establecido una representación en la que q es diagonal, y donde 
p = —ih d/dq. De la simetría entre q y p se deduce que también podemos 
establecer una representación en la que p sea diagonal y donde 


g = iñd/dp, (51) 


El operador d/dp lo definiremos de forma análoga a como hicimos para 
d/dg. A esta representación se le denomina representación de momentos. 
Es menos útil que la representación de Schródinger de la sección anterior, 
pues ésta nos permite expresar toda función de q y p, que sea desarrollable 
en serie de potencias respecto a p como un operador de derivación, mien- 
tras que la representación de momentos nos permite expresar como opera- 


108 CONDICIONES CUÁNTICAS 


dor de derivación las funciones de q y p que sean desarrollables en serie 
respecto a q, y las cantidades más importantes de la dinámica casi siempre 
son series de potencias de p y muy pocas veces son series de potencias de q. 
Sin embargo, la representación de momentos tiene utilidad para algunos 
problemas (véase $ 50). 

Calculemos la función de transformación <q”|p'> que relaciona ambas 
representaciones. Los kets básicos |p”> de la representación de momentos 
son autokets de p, y sus representantes en la representación de Schródinger 
<q'lp'> están dados por (47) con unos coeficientes c” convenientemente elegi- 
dos. Los factores de fase de estos kets básicos se tienen que elegir de tal 
modo que (51) sea válida. El método más sencillo de obtener esta condición 
es considerar la simetría que hemos visto antes entre q y p, según la cual 
<q'Ip'> se ha de transformar en <p'|g”> al intercambiar q” con p” y escribir 
—4 en lugar de í. Pero <q'|p'> es igual al segundo miembro de (47) y 
<p'lg'> es su complejo conjugado, de donde se sigue que c” ha de ser 
independiente de p”. Luego, c” es un número Cc. Además debe verificarse 


<plp”> = sp" —p”), 
que comparada con (50) nos indica que lc] = h”*. Podemos elegir los facto- 


res de fase constantes y arbitrarios de cada representación de modo que 
sea c = h”3, con lo que resulta la siguiente función de transformación: 


<q p.> = hrtetoo/r (52) 


Todo esto puede generalizarse a un sistema con n grados de libertad, 
para el que existen n coordenadas q; y pi, y para el que los autovalores de 
cada una de las q, vayan desde —oo a 4-00. Entonces cada p, será un obser- 
vable cuyos autovalores irán también desde —o a «o, y existirá una sime- 
tría entre el conjunto de q; y el de p, cuyas relaciones de conmutación 
permanecerán invariantes al intercambiar cada q, con su correspondiente 
P» y poner —i en lugar de ¿. Se podrá establecer una representación con 
las p; diagonales y en la que cada 


La función de transformación que nos relacionará esta representación con 
la de Schródinger vendrá dada por el producto de las funciones de trans- 
formación relativas a cada grado de libertad, según indica la fórmula (67) 
de $ 20 y, por tanto, será 


ANI po = <q p< lp >.<, lpr,> 
— he a trat tp ar)/A (54) 
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24. El principio de incertidumbre de Heisenberg 


Para un sistema que no tenga más que un grado de libertad, los repre- 
sentantes de un ket |[X> en las representaciones de Schródinger y de mo- 
mentos están relacionados por 


<p X> == hr+ f e tao'/ñ dq' <q X>, 
= (55) 
<q (X> = hh j eiuo'/h dp' <p! IX>. 


-- 00 


Estas fórmulas tienen un significado elemental. Nos dicen que cada uno 
de los representantes viene dado, salvo coeficientes numéricos, por las 
amplitudes de las componentes de Fourier del otro. 

Es interesante aplicar (55) a un ket cuyo representante en la repre- 
sentación de Schródinger sea lo que se denomina un paquete de ondas. 
Esto quiere decir, una función cuyo valor sea muy pequeño fuera de un 
cierto dominio de amplitud Ag”, dentro del cual sea aproximadamente 
periódico con una frecuencia definida.? Si hacemos el análisis de Fourier 
de este paquete de ondas, todas las amplitudes de las componentes de 
Fourier serán pequeñas excepto las del entorno de una frecuencia definida, 
Las componentes cuya amplitud no será pequeña estarán dentro de una 
banda de frecuencias * de anchura aproximada 1/Ag”, pues dos compo- 
nentes cuyas frecuencias difieran en esta cantidad, si están en fase en el 
medio del dominio Ag”, estarán en oposición de fase e interferirán hacia 
el extremo de dicho dominio. En la primera de las ecuaciones (55), la 
variable que hace las veces de frecuencia es (27) p"/h = p'/h. Luego, 
si <g"IX> tiene la forma de un paquete de ondas, la función <p'|X> que 
viene dada por las amplitudes de Fourier del paquete de cndas tendrá un 
valor pequeño en todo el espacio de p” salvo en un cierto dominio de 
anchura Ap! = h/Ag”. 

Apliquemos ahora la interpretación física según la cual el cuadrado del 
módulo del representante de un ket representa una probabilidad. 

Resulta entonces que nuestro paquete de onda representa un estado en 
el que casi con certeza toda medida de q da un valor comprendido en un 
cierto dominio de anchura Ag” y toda medida de p da un valor compren- 
dido en un dominio de anchura Ap”. Diremos que en este estado q tiene 
un valor definido con un error del orden de Ag”, y que asimismo p tiene un 
valor definido con un error del orden de Ap”. El producto de los dos 
errores es 


* Aquí, frecuencia quiere decir el recíproco de la longitud de onda. [N. del T.: 
Es decir, la palabra frecuencia se emplea aquí para designar el número de ondas.] 
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Ag'Ap' == h. (56) 


Es decir, cuanto mayor sea la precisión sobre una de las variables p o q 
tanto menor será la precisión sobre la otra. En un sistema con más de 
un grado de libertad la ecuación (56) se aplica por separado a cada uno. 

La ecuación (56) se conoce con el nombre de principio de incertidumbre 
de Heisenberg. En ella se ve claramente el grado de limitación que existe 
en asignar simultáneaemnte valores numéricos en un estado particular a 
dos observables que, como las coordenadas canónicas conjugadas, no con- 
mutan, y constituye un ejemplo claro de en qué sentido pueden ser incom- 
patibles las medidas en mecánica cuántica. También nos indica por qué la 
mecánica clásica, que supone la posibilidad de asignar simultáneamente 
valores numéricos a todos los observables, es una aproximación válida 
cuando h se puede considerar suficientemente pequeña para ser despreciada. 
La ecuación (56) solamente es válida en el caso más favorable de que el 
representante del estado sea de la forma de un paquete de ondas. Para 
otras formas de representante obtendríamos unos Ag” y Ap” cuyo producto 
sería mayor que h. 

El principio de incertidumbre de Heisenberg nos indica que en el límite, 
cuando una de las variables q o p esté completamente determinada, la otra 
estará completamente indeterminada. También podríamos haber llegado 
a este mismo resultado directamente a partir de la función de transforma- 
ción <g'Ip'>. Según dijimos al final de $ 18, | <q'lp'> [?dq” es proporcional 
a la probabilidad de que q tenga un valor comprendido en el pequeño 
intervalo (q”, q” + dq”) en el estado en que p tiene con certeza el valor p”, 
y según (52) dicha probabilidad es independiente de q” para un dq” dado. 
Luego, si p tiene con toda seguridad el valor definido p”, todos los valores 
de q son igualmente probables. Análogamente, si q tiene con toda seguridad 
un valor definido q”, todos los valores de p son igualmente probables. 

Desde el punto de vista físico es evidente la imposibilidad de obtener 
un estado para el que sean igualmente probables todos los valores de qo 
todos los valores de p; en el primer caso debido a la limitación de espacio 
y en el segundo a la limitación de energía. Por lo tanto, en la práctica no 
se pueden realizar los autoestados de p y q. El argumento del final de $ 12 
ya nos indicaba que no era posible realizar dichos estados basándose en 
que para ello sería necesaria una precisión infinita, y ahora hemos dado otro 
argumento que nos conduce a la misma conclusión. 


25. Operadores de traslació 
pon Pa ción 


Obtendremos nueva luz acerca del significado de algunas condiciones 
cuánticas tras haber estudiado los operadores de traslación. Estos opera- 
dores aparecen en la teoría al considerar que el esquema dado en el capí- 
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tulo II, que relaciona los estados y las variables dinámicas, es esencialmente 
un esquema físico, y consiguientemente si existe una relación entre ciertos 
estados y variables dinámicas, trasladándolos todos del mismo modo (por 
ejemplo, trasladándolos en una magnitud $x en la dirección del eje x de 
unas coordenadas cartesianas) los correspondientes estados y variables 
dinámicas trasladados tienen que seguir verificando la misma relación. 

La traslación de un estado o de un observable son procesos perfecta- 
mente definidos desde el punto de vista físico. En efecto, para trasladar un 
estado o un observable una distancia 3x en la dirección del eje x, basta 
con trasladar todos los aparatos utilizados para preparar el estado o todos 
los aparatos utilizados para medir el observable”én una distancia $x en 
dicha dirección. Los aparatos trasladados definirán el estado o el observable 
trasladado. La traslación de una variable dinámica ha de estar tan bien 
definida como la traslación de un observable, dada la estrecha relación 
matemática que existe entre variables dinámicas y observables. Un estado 
o una variable dinámica trasladados deben estar perfectamente definidos 
por el estado o la variable dinámica sin trasladar y la dirección y magnitud 
de la traslación. 

En cambio, la traslación de un ket no está tan claramente definida. Si 
tomamos un cierto ket, éste representa un cierto estado que por traslación 
se convierte en un nuevo estado perfectamente definido; pero el nuevo 
estado no determina univocamente al ket trasladado, sino únicamente su 
dirección. Para ayudar a determinar el ket trasladado podemos exigir que 
tenga la misma longitud que el ket sin trasladar, pero aún así sigue sin 
estar completamente determinado, y se le puede multiplicar por un factor 
de fase arbitrario. A primera vista podríamos pensar que cada ket trasla- 
dado podría tener un factor de fase distinto, pero vamos a ver que tiene que 
ser el mismo para todos. Haremos uso de la regla según la cual las rela- 
«clones de superposición entre estados han de ser invariantes frente 2 as 
traslaciones. Una relación de superposición entre estados se expresa mate- 
máticamente por una ecuación lineal entre los kets que corresponden a 
dichos estados, como por ejemplo 


¡R> = ci]A> + co]B>, (57) 


donde c, y cz son números; y la invariancia de la relación de superposición 
se expresará diciendo que los estados trasladados han de corresponder a 
kets que satisfagan la misma ecuación lineal de antes — en nuestro ejemplo 
corresponderán a unos [Rd>, |Ad> y |Bd> que habrán de verificar 


[¡Rd> = cilAd> + ca|Bd)>. (58) 


Tomaremos como kets trasladados a éstos y no a éstos multiplicados por un 
factor de fase independiente para cada uno de ellos, en cuyo caso verifica- 
rían una ecuación lineal con coeficientes Cc, y Cz distintos. Ahora la única 
arbitrariedad en la elección de los kets trasladados es un único factor de 
fase arbitrario que puede multiplicar a todos. 
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La condición de que las ecuaciones lineales entre kets sean invariantes 
frente a las traslaciones, o sea, de que si es válida una ecuación cualquiera 
de la forma (57) lo sea también su correspondiente (58), significa que los 
kets trasladados son funciones lineales de los kets sim trasladar y que, en 
consecuencia, cualquier ket |Pd> es el resultado de aplicar un cierto Opera- 
dor lineal al correspondiente ket [P> no trasladado. Es decir, 


¡Pd> = DIP>, (59) 


siendo D un operador lineal independiente de |P> y que sólo depende de 
la traslación. El hecho de que los kets trasladados puedan ser multiplicados 
por un factor de fase arbitrario se traduce en que D esté indeterminado en 
un factor numérico arbitrario de módulo unidad. 

Habiendo fijado los kets trasladados tal como hemos hecho, y en conse- 
cuencia, fijando también los bras trasladados por la condición de que sean 
los imaginarios conjugados de los kets, podemos afirmar que cualquier 
ecuación simbólica entre kets, bras y variables dinámicas tiene que perma- 
necer invariante cuando trasladamos todos los símbolos que aparecen en 
ella, pues dicha ecuación tiene un significado físico que no puede cambiar 
por la traslación. 

Tomemos como ejemplo la ecuación 


<QIP> = c, 
en la que c es un número. Entonces debe verificarse 
<Qd|Pd> = c = <QIP>. (60) 
La conjugada imaginaria de (59), poniendo Q en lugar de P da 
<Qd| = <QID. | (61) 


De (60) obtenemos ahora 
<O|DDIP> = <Q|P>. 
y como esto es válido para cualesquiera <Q| y [P>, resulta 
DD=1 yv (82) 


que es una condición general que debe satisfacer D. 
Como segundo ejemplo consideremos la ecuación. 


vIP> = |R>, 


siendo v una variable dinámica cualquiera. Entonces, si 04 representa la 
variable dinámica trasladada, debe verificarse 


ValPd] == IRd>. 
Con ayuda de (59) obtenemos 
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valPd> = D|R> = Do|P> = DvD ”*|Pd>. 


y como |Pd> es un ket cualquiera, debe ser | 


Va = DvD”, g (63) 


ecuación que indica que el operador lineal D no sólo determina la trasla- 
ción de kets y bras, sino también de las variables dinámicas. Nótese que el 
factor numérico arbitrario de módulo unidad que puede multiplicar a D no 
afecta a 04, y por tanto, no afecta tampoco la validez de (62). 

Pasemos a considerar ahora una traslación infinitesimal, es decir, consi- 
deremos una traslación 3x en la dirección del eje x y hagamos que 3x >0. 
Por continuidad física hemos de suponer que el ket trasladado ¡Pd> 
tiende al ket original [P>, y asimismo debemos suponer que existe el límite 


— |P D—1 
lim lic 448 = lim ———- |P> 
82,0 0x da, 0 0% 
Ello exige que exista_el límite 
lim (D— 1)/3x (64) 


02.0 


Tal límite es un operador lineal que llamaremos el operador de traslación 
en la dirección del eje x, y lo representaremos por d,. El factor numérico ef' 
con y real que puede multiplicar a D tiene que tender a la unidad cuando 
3x0, lo que introduce una arbitrariedad en d., que puede ser sustituido por 


lim (Detr — 1)/8x = lim (D— 1 + iy)/8x = de + 10, 


02.,0 d0.,0 


siendo a, el límite de y/8x. Por tanto, d, contiene un término aditivo cons- 
tituido por un número imaginario puro arbitrario. | 
Para pequeños éx, 


D = 1 +8x da, (65) 
Sustituyendo esto en (62) resulta 
(1 + 8x dy)(1 + dx d;) = 1, 
que despreciando gx? se reduce a 
3x(da + da) = 0. 


Luego, d, es un operador lineal imaginario puro. Sustituyendo (65) en (63) 
y despreciando de nuevo 8x? resulta 


Dg = (1 + 8x dajo(1 — 8x d,) = v + 8x(d, v — 0 de), (66) 
que demuestra que 
lim (04 —0)/8x — d,¿0—U dy. (67 
2.3.0 


8. — CUÁNTICA 
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Para describir un sistema dinámico cualquiera podemos utilizar las si- 
guientes variables dinámicas: las coordenadas cartesianas x, y, z del centro 
de gravedad del sistema, las componentes Pa, Py, Ps del momento total del 
sistema, que son las coordenadas canónicas conjugadas respectivas de 
x, Y, z, y cualesquiera otras variables dinámicas que sean necesarias para 
describir los grados de libertad internos. Si el conjunto de aparatos que nos 
servían para medir x lo trasladamos una distancia 8x en la dirección del 
eje x, medirá x — 8x, luego, | 


Xa = X-—-0X. 
Comparando este resultado con (66) para v = x obtenemos 
dax—2xd, =—l, (68) 


que es la relación de conmutación entre d, y x. Con argumentos análogos 
veríamos que y, 2, Pz, Py» Pz así como las variables dinámicas internas, al 
no estar afectadas por la traslación, tienen que conmutar con d¿. Compa- 
rando estos resultados con (9) vemos que ihid, verifica exactamente las 
mismas relaciones de conmutación que Pa. Su diferencia, pa —thd,, con- 
muta con todas las variables dinámicas, y por tanto tiene que ser un número. 
Dicho número, que es real necesariamente, pues p, y id, son ambos reales, 
puede hacerse igual a cero eligiendo convenientemente el número imagi- 
nario puro que se podía sumar a d,. En ese caso resulta 


Pa = th da, = EE Al | (69) 


o sea, que la componente x del momento lineal total del sistema es igual 
al operador de traslación d, multiplicado por ih. 

Éste es un resultado fundamental que da un nuevo significado a los 
operadores de traslación. Análogamente llegamos a conclusiones correspon- 





dientes para y y z con los operadores de traslación d, y d,. Las condiciones 
cuánticas que nos indican que Ps, Py Y P. conmutan entre sí pueden inter- 
pretarse relacionándolas con el hecho de que las traslaciones según direc- 
ciones distintas son operaciones conmutables. 


26. Transformaciones unitarias 


Sea U un operador lineal cualquiera que tenga recíproco U”* y consi- 
deremos la ecuación 


q> a* = UU”, (70) 


en la que «a es un operador lineal cualquiera. Esta ecuación puede consi- 
derarse como una transformación que a cada operador lineal a le hace 
corresponder un operador lineal a”, y en este sentido tiene propiedades 
muy notables. En primer lugar, todo a” tiene los mismos autovalores que 
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su correspondiente «a; pues si «” es un autovalor de a y |a”> es un autoket 
perteneciente a él, se tiene 
ala> = q a'> 
y, por tanto, 
arUja> = UaU*Ula”> = Uqla'> = «“Ula”>, 


que demuestra que Ula/> es un autoket de a” perteneciente al mismo 
autovalor a”; y análogamente podemos ver que todo autovalor de a” es auto- 
valor de a. Además, si consideramos diversos « que estén relacionados por 
ecuaciones algebraicas, y los transformamos de acuerdo con (70), los corres- 
pondientes a” estarán ligados por las mismas ecuaciones algebraicas. Esta 
conclusión se basa en el hecho de que los procesos algebraicos fundamen- 
tales de suma y multiplicación son invariantes frente a la transforma- 
ción (70), según indican las siguientes ecuaciones: 


(d1 + 02) = Ul(a + goJU = Un U “14 UaU“ = a? +42, 
(a, a)? = Uq a. U* = Ua, U”*Ua, U”* = aa 
Veamos cuál es la condición que deberíamos imponer a U para que 


transformase todo operador « real en otro a” también real. La ecuación (70) 


se puede escribir 
ar U —= Ua. (71) 


Tomando el complejo conjugado en ambos miembros, de acuerdo con (5) 
de $ 8, si a y a* son reales, se tiene 


Ua* — aU. (72) 
La ecuación (71) da 
Ua*U — UU4a 
y la (72) da 
0a*U — aUU. 
Luego, 
UU = «UU. 


Por tanto, UU conmuta con cualquier operador lineal real y en consecuen- 
cia conmuta también con cualquier operador lineal, pues todo operador 
lineal se puede descomponer en uno real y otro también real multiplicado 
por ¿. Luego, UU es un número. Evidentemente es real, pues de acuerdo 
con (5) de $ 8, su complejo conjugado es igual a él; y además tiene que ser 
un número positivo, ya que para cualquier ket |[P>, <P|UUIP> es positivo, 
igual que <P|P>. Podemos suponer que es igual a uno sin pérdida de gene- 
ralidad en la transformación (70). Entonces tenemos 


OU = 1. (73) 
La ecuación (73) es equivalente a cualquiera de éstas: 
UU =0*%6 =U?.U"0*= 1. (14) 
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Una matriz o un operador lineal U que verifique (73) y (74) se dice que 
es unitario, y una transformación (70) con U unitario se dice que es una 
transformación unitaria. Una transformación unitaria transforma operadores 
lineales reales en operadores lineales reales y deja invariante cualquier 
ecuación algebraica entre operadores lineales. Puede considerarse que actúa 
sobre kets y bras según las siguientes ecuaciones 


¡P*> = UlP>,  <P*| = <P[O = <PJU-, (75) 


y entonces deja invariante también cualquier ecuación algebraica entre 
operadores lineales, kets y bras. Transforma autovectores de «a en autovec- 
tores de a”. De aquí se deduce fácilmente que transforma observables en 
observables y que deja invariante toda relación funcional entre observables 
basada en la definición general de función dada en $ 11. 

La inversa de una transformación unitaria es a su vez una transforma- 
“ción unitaria, pues según (74), si U es unitario, U”* también lo es. Además, 
si realizamos dos transformaciones unitarias una detrás de otra, el resultado 
es una tercera transformación unitaria, como vamos a ver seguidamente. 
Sean (70) y 

at — Va*Vva1, 


las dos transformaciones unitarias. La relación entre at y «, según (42) 
de $ 11 será entonces 
at —= VUaU”V"1 
= (VIDa(VU)* (76) 


Pero VU es unitaria, ya que 
VOVU = UVVU = UU —= 1, 


luego, (76) es una transformación unitaria. 

Las transformaciones de traslación dadas en la sección anterior cons- 
tituyen un ejemplo de transformaciones unitarias, pues como se ve, las 
ecuaciones (62) y (63) corresponden a (73) y (70), y las (59) y (61) corres- 
ponden a las ecuaciones (75). 

En mecánica clásica puede hacerse un cambio de coordenadas canó- 
nicas y pasar de q», pr (r = 1, ..., n) a un nuevo conjunto de variables 
q?, p? (r = 1, ..., n), que tienen los mismos P.B. entre ellas que las 
q y pes decir, que verifican las ecuaciones (8) de $ 21 poniendo q* y p* 
en lugar de las q, y pr, y de tal modo que toda variable dinámica se puede 
expresar como función de las q* y p”. Se dice que las q” y p” constituyen 
otro conjunto de coordenadas capfnicas, y el cambio de coordenadas se 
llama transformación de contacto”"Puede comprobarse fácilmente que el 
P.B. de las variables u y v viene dado en función de las q* y p” por la 
misma fórmula (1) de $ 21 sustituyendo g_y p por q” y p”, luego, los P.B. 
son invariantes frente a las transformaciones de contacto. Esto se traduce 
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en que las nuevas coordenadas canónicas están en pie de igualdad con las 
antiguas para muchos fines de la teoría dinámica general, si bien q? y p; 
puede no ser un conjunto de coordenadas lagrangianas, sino ser funciones 
de las coordenadas y de las velocidades lagrangianas. 

Vamos a demostrar ahora que para un sistema dinámico de la mecánica 
cuántica que tenga una imagen clásica, las transformaciones unitarias de la 
teoría cuántica corresponden a las transformaciones de contacto de la teoría 
clásica. Las transformaciones unitarias son más generales que las transfor- 
maciones de contacto, pues las primeras se pueden aplicar a sistemas cuán- 
ticos que no tengan imagen clásica, pero para los sistemas de la mecánica 
cuántica que se pueden describir en función de coordenadas canónicas es 
válida la analogía. Para establecerla veamos que si aplicamos una transfor- 
mación unitaria a unas variables cuántics Q- y Pr, Obtenemos unas nuevas 
variables q” y p” que tienen los mismos P.B., pues los P.B. son equivalentes 
a las ecuaciones algebraicas (9) de $ 21, y las ecuaciones algebriacas son 
invariantes frente a las transformaciones unitarias. Recíprocamente, todo 
conjunto de variables reales q* y p? que tengan unos P.B. iguales que los 
correspondientes a coordenadas canónicas están ligados a las q, y p, por una 
transformación unitaria, como vamos a ver a continuación. 

Utilizaremos la representación de Schródinger, y para abreviar escribi- 
remos los kets básicos q q > simplemente |g”>. Como hemos supuesto 
que las q? y p* tienen unos PB. iguales a los que corresponden a un con- 
junto de coordenadas canónicas, podemos establecer para ellos una repre- 
sentación de Schródinger en la que cada q sea diagonal y en la que 
cada p” sea igual a —ih0/0q*. Los kets básicos de esta segunda represen- 
tación de Schródinger serán |g””...q”">, que para abreviar designare- 
mos |g*”>. Introduzcamos el operador lineal U definido mediante la re- 
lación 


S <q*"Ulg"> — 8(q** — 9”), (77) 
donde para abreviar, 3(q*” — q”) indica 
q —q) = sq —q 397 —q).. q —q'). (78) 


La ecuación compleja conjugada de (77) es 


; <gUlg*”> — 8(q* — q”), 
uego, 


t Utilizamos la notación abreviada de escribir un solo signo integral y dq*” para 
indicar una integración respecto a las variables q?”, q3”, ..., q;'. Esta abreviación se 
seguirá utilizando de aquí en adelante. 
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<q"0U|q”> o ! <q 10|q*"> dq” <g*"Ulg”> 


= j aq” e. g”) dg” s(q* 7 g”) 
SS (q 7 g”, 


y por tanto, 
UU = L 


En consecuencia, U es un operador unitario. Tenemos además que 
<q*19*Uig> = qq" — q) 


y 
<q"1Ug lg = aq" — 99, - 


Los segundos miembros de ambas ecuaciones son iguales según la propie- 
dad (11) de $ 15 de la función $, y por tanto, 


qhU = Ug. 
o bien 
q” = Ug, U71, 


r 


Además, de (45) y (46) resulta 
O 








<q""p?Ulg”> = —¡h aq" — q, 
0q; 
e/ , 4 0 Sr pr 
<q"Up.q"> = ih—3(q" — q). 
09, 


Los segundos miembros de estas dos ecuaciones son evidentemente iguales, 
y, por tanto, 
p"U = Up 
o bien 
p* = Up U”!, 
r Y 
Luego, se verifican todas las condiciones que se exigen para que la trans- 
formación sea unitaria. 
Para obtener una transformación unitaria infinitesimal, tomemos U 
en (70) de forma que difiera de la unidad en un infinitésimo. Pongamos 


U —= 1+4sF, 
donde e es un infinitésimo, y su cuadrado puede ser despreciado. Entonces 
U-1 = 1 —deF. 
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La condición (73) o (74) de que U sea unitario exige que F sea real. La 
ecuación de transformación (70) se traduce en 


a” = (14 iPja(l — ieF), 


que nos da 
ar —a = ls(Fa — qF). (79) 
Esta ecuación se puede escribir en notación de P.B. 
a* —« = eh[a, Fl. (80) 


Si « es una coordenada canónica, esta ecuación equivale formalmente a 
una transformación de contacto infinitesimal de la mecánica clásica. 


V 


LAS ECUACIONES DEL MOVIMIENTO 


27. Ecuaciones del movimiento en imagen de Schródinger 


Todo nuestro desarrollo desde el $ 5 se ha limitado a considerar un solo 
instante de tiempo. Hemos expuesto el esquema general de las relaciones. 
entre estados y variables dinámicas para un sistema dinámico en un ins- 
tante de tiempo. Para completar la teoría dinámica, hemos de considerar a 
su vez la conexión entre diferentes instantes de tiempo. Cuando se lleva 
a cabo una observación del sistema dinámico, su estado cambia de forma 
impredictible, pero entre observación y observación sigue habiendo _causa- 
lidad n mecánica cuántica como en la clásica, y el sistema está 
regido por ecuaciones de movimiento que hacen que el estado en un 
cierto instante determine el estado en un instante posterior. Vamos a estu- 
diar a continuación estas ecuaciones del movimiento. Se aplicarán mientras 
el sistema no sea alterado por una observación o un proceso análogo.? Su 
expresión general se puede deducir del principio de superposición del 
capítulo 1. A A 

Consideremos un estado de movimiento particular durante el tiempo 
en que el sistema permanece inalterado. En cada instante t el estado co- 
rresponderá a un cierto ket que, en consecuencia, dependerá de £ y al que 
podemos designar |t>. Cuando consideremos varios estados de movimiento, 
los distinguiremos unos de otros añadiéndoles otros símbolos, tales como A, 
y así escribiremos el ket que corresponde a uno de estos estados en el 
tiempo t, [At». La exigencia de que el estado en un instante determine 
el estado en un instante posterior, quiere decir que |A%o> determina |A£> a 


menos de un factor numérico. El principio de superposición s - 
chos estados ovimiento durante el tiempo en que el sistema permanece 


. > * y . ». e 
inalterado, y dice que si tomamos una relación de superposición válida 


A 


o 


E A A A AX A NA 





t La preparación de un estado es un proceso de este tipo. A menudo consiste en 
llevar a cabo una observación y seleccionar el sistema cuando el resultado de la obser- 
vación es con seguridad un cierto número prefijado. 
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para ciertos estados en el tiempo to y que da lugar a una ecuación lineal 
entre los correspondientes kets, como por ejemplo 


|¡Rto> = ci]Ato> + ColBto>, 
ello exige que siga siendo válida la misma relación de superposición entre 


los estados de movimiento durante todo el tiempo en que el sistema perma- 
nezca inalterado. Por tanto, debe conducirnos a la misma ecuación entre los 
kets correspondientes a dichos estados en un instante + (dentro del inter- 
valo de tiempo en que no hay alteración), o sea, a la ecuación 


IR£> = cilAt> + colBto, 


siempre que -elijamos de forma conveniente los factores numéricos arbj- 
trarios que pueden multiplicar.a.estos kets. De aquí se sigue que los-|Pt> 
son funciones lineales de los |Pty> y que cada |Pt> es el resultado de aplicar 
un cierto operador lineal a a O sea 


Pt) = ripio, ) (1) 


e 5 


donde T es un operador lineal independiente de P y dependiente sólo 
de t (y to). A 

Supongamos ahora que cada |Pt> tenga la misma adi que el corres- 
pondiente |Pty>. No siempre es posible escoger los factores numéricos 
arbitrarios por los cuales, según hemos visto, deben ir multiplicados los |Pt> 
sin destruir la dependencia lineal de los |Pt> con los |Pto>; de esta forma, 
la nueva hipótesis es de naturaleza física, y no una simple cuestión de 
notación. Constituye una generalización del principio de superposición, La 
arbitrariedad en [Pe> se convierte asi en un simple factor de fase que, si se 
quiere conservar la dependencia lineal de los [Pt> con los |Ptp>, ha de ser 
independiente de P. De la condición de que la longitud c,|Pt> + ce|Qt> 
sea igual a la de c,|Pto> + calPto> para cualesquiera números complejos 
C1 y Cz, podemos deducir que 


<QtPt> = <QtojPto>. (2) 


La conexión entre los |Pt> y los |P£y> es análoga formalmente a la que ligaba 
los kets trasladados y los no trasladados en $ 25, si bien ahora se trata de 
un proceso de traslación en el tiempo en vez de en el espacio. Las ecua- 
ciones (1) y (2) juegan el papel de las ecuaciones (59) y (60) de $ 25. 
Podemos desarrollar las consecuencias de estas ecuaciones de la misma 
manera que hicimos en $ 25 y deducir que T contiene un factor numérico 
arbitrario de módulo unidad y verifica 


TT = 1, (3) 


en correspondencia con (62) de $ 25; luego, T' es unitario. Pasamos al caso 
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infinitesimal haciendo t >to y suponiendo por continuidad física que existe 
el límite — 


, |PE> _— [Pto> 
tot, t—lo 


Dicho límite es la derivada de |Pty> respecto a to. Según (1), esto equi- 
vale a a 
AlPto> T=i | 
0 Mm Pto». y 
dto Us,s E—to 








(4) 


Igual que en (64) de $ 25, el operador límite que aparece aquí es un opera- 
dor lineal imaginario puro y está indeterminado en un número arbitrario 
aditivo imaginario puro. Llamando H a este operador límite multiplicado 
por ¿ñ, o mejor H(to) ya que puede depender de to, la ecuación (4) se 
transforma, cuando la escribimos para un t general, en 


10 ie —= H(b|Pt 9) 
ñ—_— = (£)|Pe>. ( 


La ecuación (5) expresa la ley general de variación con el tiempo del ket 


correspondiente al estado en un instante cualquiera. Es la ecuación del 
movimiento en imagen de Schródinger. En ella aparece un operador lineal 
real H(€), que ha de ser característico del sistema dinámico en cuestión. 
Supondremos que H(£) es la energía total del sistema. Se pueden dar dos 
justificaciones de esta hipótesis, (1) la analogía que existe con la mecánica 
clásica que será desarrollada en la sección próxima, y (ii) H(t) es igual a un. 
operador de traslación en el tiempo multiplicado por ¿h, similar a los ope- 
radores de traslación en las direcciones x, y, z de $ 25, que en corres- 
pondencia con (69) de $ 25 induce a tomar H(*) igual a la energía total, 
pues la teoría de la relatividad sitúa la energía en la misma relación res- 
pecto al tiempo que el momento respecto a la distancia. 

Por razones físicas, supondremos que la energía total de un sistema es 
siempre un observable. Para un sistema aislado es una constante y se 
puede escribir H. Muchas veces, aunque no sea una constante, la escribi- 
remos simplemente H, sobreentendiendo su dependencia temporal. Si la 
energía depende de £, significa que actúan fuerzas externas sobre el sistema. 
Hay que distinguir entre una acción de este tipo y una alteración causada 
por un proceso de observación, pues la primera es compatible con la causa- 
lidad y las ecuaciones del movimiento y la segunda no. 

Podemos establecer una relación entre H(t) y el T de la ecuación (1). Así 





dT 
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Como |Pty> puede ser un ket cualquiera, tenemos 
ih cd H(T (6) 
ii = 
dt 


La ecuación (5) tiene mucha importancia en problemas prácticos, donde, 
a menudo, se utiliza unida a una representación. Introduciendo una repre- 
sentación mediante un conjunto completo de observables diagonales É 
que conmutan, y haciendo <E”[Pt> igual a 4(8%), tenemos, al pasar a la 
notación del ket standard, 


Pt = yY(Eb)>. 
La ecuación (5) se transforma en 
iñ4(E0) = HE0. (7) 


La ecuación (7) se conoce con el nombre de ecuación de onda de Schró- 
dinger, y sus soluciones 4(Et) son funciones de onda dependientes del 
tiempo. Cada solución corresponde a un estado de movimiento del sistema, 
y el cuadrado de su módulo da la probabilidad de que los £ tengan valores 
determinados en un instante t dado. Para los sistemas que se pueden des- 
cribir mediante un conjunto de coordenadas canónicas podemos elegir una 
representación de Schródinger y tomar entonces H como un operador de 
derivación de acuerdo con (42) de $ 22, 


28. Ecuaciones del movimiento en imagen de Heisenberg 


En la sección precedente hemos establecido una imagen de los estados 
de movimiento no alterados, en la que cada uno de ellos correspondía 
a un ket en movimiento, y el estado en un instante cualquiera correspondía 
el ket en dicho instante. Esta descripción se designa imagen de Schródinger. 
Aplicaremos a estos kets la transformación unitaria que hace pasar cada 
ket ja> al | 
lat? = 7210 (8) 


Esta transformación es de la forma dada por (75) de $ 26, con T”* para U, 
pero depende del tiempo t, ya que T depende de £. La imagen de esta 
transformación es la aplicación de un movimiento continuo de todo el 
espacio de los kets (que consiste en rotaciones y deformaciones uniformes). 
Un ket fijo inicialmente pasa a estar en movimiento, movimiento que viene 
dado por (8) con |ja> independiente de £. En cambio, un ket que inicial- 
mente estaba en movimiento siguiendo a un estado de movimiento no alte- 
rado, o sea, moviéndose de acuerdo con la ecuación (1), pasa a estar fijo, 
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ya que al sustituir |Pt> por |a> en (8) obtenemos |a?> independiente de t. 
De esta forma, la transformación conduce al reposo los kets correspondien- 
tes a los estados de movimiento no alterados. 

Debemos aplicar también la transformación unitaria a los bras y a los 
operadores lineales, de forma que las ecuaciones entre las diversas canti- 
dades permanezcan invariantes. La transformación aplicada a los bras viene 
dada por la imaginaria conjugada de (8), y la aplicada a los operadores 
lineales está dada por (70) de $ 26 con T”* para U, es decir, 


a” = Tal. (9) 


Un operador lineal que inicialmente está fijo se transforma en general en 
un operador lineal en movimiento. Ahora bien, una variable dinámica co- 
rresponde a una operador lineal que está inicialmente fijo (pues no depende 
de + de ninguna forma), y por tanto, después de la transformación le 
corresponde un operador lineal en movimiento. Así, la transformación nos 
conduce a una nueva imagen del movimiento, en la cual los estados corres- 
ponden a vectores fijos y las variables dinámicas a operadores lineales en 
movimiento. Esta descripción constituye la imagen de Heisenberg. 

La condición física del sistema dinámico en cualquier instante implica 
una relación entre las variables dinámicas y el estado; la variación de la 
condición física en el tiempo puede ser atribuida o bien a un cambio en el 
estado manteniendo fijas las variables dinámicas, que nos lleva a la imagen 
de Schródinger, o bien a un cambio en las variables dinámicas en el que 
permanecen fijos los estados, que constituye la imagen de Heisenberg. 

En la imagen de Heisenberg hay ecuaciones de movimiento para las 
variables dinámicas. Tomemos una variable dinámica correspondiente al 
operador lineal fijo v en la imagen de Schródinger. En la imagen de Heisen- 
berg corresponderá a un operador lineal en movimiento que designare- 
mos v, en vez de v* para poner de manifiesto su dependencia de t, y que 
vendrá dado por 





Os = TivT (10) 
o bien 
To, = OT. 
Derivando respecto a £, tenemos 
-aT 47 do; dT 
cra. 1) — == 
dt > de dt 


Con la ayuda de (6), resulta 


do; 
HTo, + ihT 2 = oHT 


o sea 
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do; 
da == T-wHT — THTo,; 
= 0,H,— H;os, (11) 
donde 
H, = T1HT. (12) 
La ecuación (11) se puede escribir en notación de P.B. 
du 
Boa = [0;, H;]. (13) 
dt 


Las ecuaciones (11) o (13) indican cómo varía con el tiempo cualquier 
variable dinámica en la imagen de Heisenberg, y constituyen_las_ecuacio- 
nes del movimiento en imagen de Heisenberg. Estas ecuaciones del movi- 
miento están determinadas por el operador lineal H que aparece en las 
ecuaciones del movimiento en imagen de Schródinger y corresponde a la 
energía en la imagen de Heisenberg. A las variables dinámicas en imagen 
de Heisenberg, en la que éstas varían con el tiempo, las denominaremos 
variables dinámicas de Heisenberg, para distinguirlas de las variables diná- 
micas fijas de la imagen de Schródinger, que llamaremos variables dinámi- 
cas de Schródinger. Cada variable dinámica de Heisenberg está relacio- 
nada con la correspondiente variable dinámica de Schródinger a través de 
la ecuación (10). Como esta ecuación es una transformación unitaria, todas 
las relaciones algebraicas y funcionales son idénticas para las dos clases de 
variables dinámicas. Para t = ty es Y = 1, de donde 0; =D, y cualquier 
variable dinámica de Heisenberg en el instante tp es igual a la correspon- 
diente variable dinámica de Schródinger. | 
La ecuación (13) puede compararse con la mecánica clásica, donde tam 

bién tenemos variables dinámicas que varían con el tiempo. Las ecuaciones 
del movimiento de la mecánica clásica se pueden escribir en la forma de 
Hamilton | 

dq, 0H dp, oH 14) 

di OP, dt dq, As 
donde las q, y las p, son un conjunto de coordenadas canónicas y H es la 
energía expresada en función de ellas y posiblemente también de t. La ener- 
gía expresada en esta forma recibe el nombre de hamiltoniano. Las ecua- 
ciones (14) dan, para cualquier función v de las q, y las p, que no contenga 
explícitamente el tiempo t, 

dv 7 Oo dq, dv dp, 

d a dt + dt | 

$ óv 0H óv 0H 
y 0q, 0p,  0p, 0q, | 


= [o, Al, (15) 
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según la definición clásica de P.B. dada por la ecuación (1) de $ 21. Esta 
ecuación es de la misma forma que la ecuación (13) en la teoría cuántica. 
Así hemos obtenido una analogía entre las ecuaciones del movimiento 
clásicas en forma de Hamilton y las ecuaciones del movimiento cuánticas 
en imagen de Heisenberg. Esta analogía nos da una justificación de la 
hipótesis de que el operador lineal H introducido en la sección precedente 
es la energía del sistema en mecánica cuántica. 

En mecánica clásica, un sistema dinámico está definido matemática- 


mente cuando conocemos. el hamiltoniano, es decir, cuando conocemos la 


WINS 2d e e 


energía expresada como función de un conjunto de coordenadas canónicas, 
pues ello es suficiente para determinar las ecuaciones del movimiento. En 
mecánica cuántica, un sistema dinámico está definido matemáticamente 
cuando conocemos la energía expresada en función. de. variables dinámicas 
cuyas felaciones de conmutación, son conocidas, pues ello basta para deter- 
minar-las-ecusciónes del movimiento tanto en imagen de Schródinger como 
en imagen de Heisenberg. Necesitamos tener, o bien H expresado en 
función de las variables de Schródinger, bien H; expresado en función de 
las correspondientes variables dinámicas de Heisenberg, siendo la depen- 
dencia funcional la misma en ambos casos. A la energía expresada en estos 
términos la denominaremos hamiltoniano del sistema dinámico en mecánica 
cuántica, manteniendo así la analogía con la teoría clásica. (Mm 7H, 

Todo sistema de la mecánica cuántica tiene siempre un hamiltoniano, 
tanto si es un sistema que tiene análogo clásico y se puede describir me- 
diante un conjunto de coordenadas canónicas como si no lo es. Pero si el 
sistema tiene un análogo clásico, su conexión con la mecánica clásica es 
particularmente estrecha, y por lo general se puede suponer que el hamil- 
toniano es la misma función de las coordenadas y momentos canónicos en 
la teoría cuántica que en la teoría clásica.? Desde luego esto entrañaría una 
dificultad si el hamiltoniano clásico comprendiera un producto de factores 
cuyos análogos cuánticos no conmutaran, ya que no se sabría en qué orden 
poner estos factores en el hamiltoniano cuántico, sin embargo, esto no 
ocurre para la mayoría de sistemas dinámicos elementales cuyo estudio 
tiene importancia en física atómica. En consecuencia, podemos utilizar 
ampliamente el mismo lenguaje para describir sistemas dinámicos en la 
teoría cuántica que en la teoría clásica (por ejemplo, refererirnos a partícu- 
las con masas dadas moviéndose en campos de fuerza dados), y dado un 
sistema en mecánica clásica, en general, podemos dar una significación de 
“el mismo' sistema en mecánica cuántica. 

La ecuación (13) se verifica para cualquier función 6; de las variables 
dinámicas de Heisenberg que no sea función explícita del tiempo, es decir, 


a 


a 


+ Esta hipótesis ha tenido éxito en la a únicamente cuando se ha aplicado 
a coordenadas y momentos dinámicos referidos a un sistema de ejes cartesianos y no a 
coordenadas curvilíneas más generales. 
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para cualquier operador lineal v que en lá imagen de Schródinger sea 
constante, Esto demuestra que una tal función o; es constante si conmuta 
con H;, o lo que es lo mismo, si Y conmuta con H. En ese caso tenemos 


Di = De, = 0, 


y decimos que o; o v es una constante del movimiento. Es necesario que U 
conmute con H en cualquier instante, que en general sólo es posible si H 
es constante. En este caso podemos sustituir H por v en (13) y deducir 
que H, es constante, lo cual demuestra que el mismo H es una constante 


del movimiento. Así pues, si el hamiltoniano es constante en la imagen de 


Schródinger, también lo es en la imagen de Heisenberg. 

Para un sistema aislado sobre el que no actúan fuerzas exteriores, siem- 
pre existen algunas constantes del movimiento. Una de ellas es la energía 
total o hamiltoniano. Otras, se derivan de la teoría de traslaciones de $ 25. 
Es evidente desde el punto de vista físico, que la energía total debe perma- 
necer invariante si todas las variables dinámicas se trasladan de un mismo 
modo, y por tanto, la ecuación (63) de $ 25 debe verificarse para va = v =H. 
Así pues, D conmuta con H y es una constante del movimiento, Pasando 
al caso de una traslación infinitesimal, vemos que los operadores de trasla- 
ción d,, d,, d, son constantes del movimiento, y por lo tanto, según (69) 
de $ 25, el momento total es una constante del movimiento. Asimismo, la 
energía total permanecerá invariante si llevamos a cabo un giro_de todas 
las variables dinámicas. De ello deduciremos en $ 35 que el momento 
angular total es una constante del movimiento. Las leyes de conservación 
de energía, momento y momento angular son válidas también para un sis- 
tema aislado en la imagen de Heisenberg en mecánica cuántica, igual que 
ocurría en mecánica clásica. 

Hemos dado dos formas de las ecuaciones del movimiento en mecánica 
cuántica. De ellas, la de Schródinger es la más empleada en problemas 
prácticos, pues da lugar.a.las.ecuaciones más.sencillas. Las incógnitas en la 
ecuación de onda de Schródinger son los números que constituyen el repre- 
sentante de un ket, mientras que la ecuación del movimiento de Heisenberg 
para um variable dinámica, si se proyecta sobre una representación, tiene 
como incógnitas los números que constituyen el representante de la variable 
dinámica. Los últimos son mucho más numerosos y, por lo tanto, más difí- 
ciles de calcular que las incógnitas de Schródinger. El valor de las ecua- 
ciones del movimiento en imagen de Heisenberg estriba en que nos propor- 
cionan una analogía inmediata con la mecánica clásica, que nos permite 
ver cómo se pueden traducir a la teoría cuántica las diversas caracterís- 
ticas de la teoría clásica, tales como las leyes de conservación a las que 
hemos aludido antes. 
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29. Estados estacionarios 


Vamos a considerar aquí sistemas dinámicos cuya energía permanece 
constante. Para este caso son válidas algunas relaciones especialmente sen- 
cillas. Se puede integrar * la ecuación (6), y teniendo en cuenta la condición 
inicial de que T = 1 para t = to, da 

T —= e7H(-0/8, 


Este resultado sustituido en (1) da 
IPE> = eiHtt)/A Pto), (16) 


que es la integral de la ecuación del movimiento de Schródinger, y sustitui- 


do en (10) da 
0 = RMN iR(0/A, (17) 


que es la integral de la ecuación del movimiento de Heisenberg (11), sien- 
do H; igual a H. Hemos obtenido así fácilmente soluciones de las ecuacio- 
nes del movimiento. Sin embargo, estas soluciones no tienen mucho valor 
práctico debido a la dificultad que lleva consigo el cálculo del operador 
e iHti-to)/ñ, a menos que H sea particularmente simple, y generalmente 
para aplicaciones prácticas es necesario volver a considerar la ecuación de 
onda de Schródinger. 

Consideremos un estado de movimiento que en el instante ty sea un 
autoestado de la energía. El ket |Pt.> que le corresponde en dicho instante 
será un autoket de H. Si H” es el autovalor al que pertenece, la ecua- 
ción (16) da | 

JP = ett PE, 


que indica que |Pt> difiere de |P£y> tan sólo en un factor de fase. Por tanto, 
el estado continúa siendo siempre un autoestado de la energía, y además 
no varía con el tiempo, puesto que la dirección de |[Pt> no varía con el 
tiempo. Estos estados se denominan estados estacionarios. La probabilidad 
de obtener cualquier resultado particular en una observación de él es inde- 
pendiente del tiempo en que se lleva a cabo la observación. Teniendo en 
cuenta nuestra hipótesis de que la energía es un observable, vemos que 
hay suficientes estados estacionarios para que un estado arbitrario sea 
dependiente de ellos. 

La función de onda y(€t) dependiente del tiempo, que representa un 
estado estacionario de energía H”, variará con el tiempo de acuerdo con 


la ley 
p(Et) = yo (Eje EUA, (18) 


+ La integración se puede efectuar como si H fuese una variable algebraica ordi- 
naria en vez de un operador lineal, porque en la operación no hay ninguna cantidad 
que no conmute con H. 
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y la ecuación de onda de Schródinger (7) se reduce para ella a 
H'bo> = Hiro». (19) 


Esta ecuación afirma simplemente que el estado representado por yy es un 
autoestado de H. A una función Yo que satisfaga (19) le llamaremos auto- 
función de H perteneciente al autovalor H”. 

En la imagen de Heisenberg, los estados estacionarios corresponden a 
autovectores fijos de la energía. Podemos establecer una representación en 
la cual todos Jos vectores básicos sean autovectores de la energía y que, en 
consecuencia, correspondan a estados estacionarios en la imagen de Heisen- 
berg. A esta representación la denominaremos representación de Heisenberg. 
El primer modelo de mecánica cuántica ideado por Heisenberg en 1925 
estaba expresado en una representación de este tipo. La energía es diago- 
nal en dicha representación. Cualquier otra variable dinámica diagonal 
debe conmutar con la energía, y por tanto, es una constante del movimiento. 
El problema de establecer una representación de Heisenberg se reduce 
entonces al problema de encontrar un conjunto completo de observables 
que conmutan, cada uno de los cuales es una constante del movimiento, y 
después diagonalizar estos observables. La energía debe ser una función 
de estos observables según el teorema 2 de $ 19. Algunas veces es conve- 
niente tomar la misma energía como uno de ellos. 

Designemos con a el conjunto completo de observables que conmutan 
en una representación de Heisenberg, con lo que los vectores básicos se 
escribirán <a”|, la">. La energía es una función de estos observables q, o 
sea H = H(a). De (17) obtenemos 


<a lo¿a”> aa <a e cto /ñ ve -¡H(t-4)/4% la/?> 
o eE (ito) 1 <a lola», (20) 


donde H' = H(a) y H” = H(a”). El factor <«'Joja””> que aparece en el 
segundo miembro es independiente de t, y es un elemento de la matriz 
que representa al operador lineal fijo v. La fórmula (20) muestra cómo 
varían con el tiempo los elementos de matriz de Heisenberg de cualquier 
variable dinámica de Heisenberg, y hace que o; satisfaga la ecuación del 
movimiento (11), como puede comprobarse fácilmente. La variación dada 
por (20) es simplemente periódica con una frecuencia 


¡H'— H"/20h = |[H'—H"//h, (21) 


que sólo depende de la diferencia de energías entre los dos estados a los 
que se refiere el elemento de matriz. Este resultado está íntimamente ligado 
a la ley de combinación de la espectroscopia y a la condición de Bohr de 
las frecuencias, según la cual (21) es la frecuencia de la radiación electro- 
magnética emitida o absorbida cuando el sistema efectúa una transición 
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entre dos estados estacionarios a” y a”, bajo la influencia de una radiación, 
siendo los autovalores de H los niveles de energía de Bohr. Estas cuestiones 
serán tratadas en $ 45. 


30. La partícula libre 


La aplicación fundamental más sencilla de la mecánica cuántica consiste 
en considerar un sistema formado simplemente por una partícula libre, 
o sea, una partícula no sometida a ninguna fuerza. Utilizaremos como va- 
riables dinámicas las tres coordenadas cartesianas, x, y, 2 y sus momentos 
conjugados Pa, Py, Pz El hamiltoniano es igual a la energía cinética de la 
partícula, es decir, 


H= (M4 P+D (22) 


de acuerdo con la mecánica de Newton, siendo m la masa. Esta fórmula 
es válida únicamente si la velocidad de la partícula es pequeña comparada 
con c, velocidad de la luz. Para una partícula que se mueve con gran velo- 
cidad, caso que se presenta a menudo en la teoría atómica, (22) debe ser 
reemplazada por la fórmula relativista 


H = c(m?c” + p? + p* + po)! (23) 


Para pequeños valores de P», Py y Pz (23) se convierte en (22) salvo el 
término constante mc? que corresponde a la energía en reposo de la par- 
tícula en la teoría de la relatividad, y que no influye en la ecuación del 
movimiento. Las fórmulas (22) y (23) se pueden traducir directamente a la 
teoría cuántica, sobreentendiéndose que la raíz cuadrada que aparece 
en (23) es la raíz cuadrada positiva definida al final de $ 11. El término 
constante mc? en que difiere (23) de (22) para pequeños valores de Pz, Py, P: 
no puede tener efecto físico alguno, pues el hamiltoniano en la teoría cuán- 
tica, tal como lo hemos introducido en $ 27, está indeterminado en una 
constante real aditiva. 

Aquí emplearemos la fórmula más exacta (23). Resolveremos en primer 
lugar las ecuaciones del movimiento de Heisenberg. Según las condiciones 
cuánticas (9) de $ 21, p, conmuta con p, y Pz, y por tanto, según el teore- 
ma 1 de $ 19 extendido a un conjunto de observables que conmutan, p, con- 
muta con cualquier función de P», Py Y Pz y por tanto, con H. Luego pa 
es una constante del movimiento. Análogamente p, y p. son también cons- 
tantes del movimiento. Estos resultados son los mismos que en la teoría 
clásica. Por otra parte, la ecuación del movimiento para una coordenada, 
por ejemplo x,, según (11), es 
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4 


da 
iRhx; = ih Pr == x c(m*c4-p?+p*4p2)*— c(mécr4-po4- popa. 





Podemos calcular el segundo miembro mediante la fórmula (31) de $ 22 
cambiando los papeles respectivos de las coordenadas y de los momentos, 
de forma que se tenga 











q —1fq- = iñ 0f/0p,, (24) 
siendo f una función de las p,. Esto da 
iu = meo + popa E 
Opa E A > 
C*py c”Pz | | 
Anál t == , E = — 
nálogamente Yi E ; Fe 


La magnitud de la velocidad es 
o= (4d = ++ A. 26) 


Las ecuaciones (25) y (26) son exactamente las mismas que en la teoría 
clásica. 

Consideremos un estado que sea autoestado de los momentos perte- 
neciente a los autovalores p”, Pp, , p” . Este estado tiene que ser un auto- 


estado del hamiltoniano perteneciente al autovalor 
H= ome + pp), (27) 


y será por tanto un estado estacionario. Los valores posibles de H” son todos 
los números desde mc? a oo, como en la teoría clásica. La función de onda 
v(xyz), que representa este estado en un instante cualquiera en la repre- 
sentación de Schródinger, debe satisfacer 


O Z 
p"p(xyz)> = Ppablayz)> = pe 


con ecuaciones análogas para p, y pz. Estas ecuaciones indican que ¿(xyz) 
es de la forma 
b(xyz) —= actu storyiprd/A, (98) 
donde q es independiente de x, y, z. De (38) resulta que la función de onda 
Y(xyzt) dependiente del tiempo es de la forma 
UlAyat) = EIA, (29) 


donde a, es independiente de x, y, 2z y t. 
La función (29) de x, y, z y t representa ondas planas en el espacio- 
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tiempo. Vemos, a la luz de este ejemplo, la conveniencia de los términos 
“función de onda” y “ecuación de onda. La frecuencia de las ondas es 

y = H'/h, (30) 
y su longitud de onda es | 


= hp +pó+ po = h/P, (31) 
donde P” es la longitud del vector (pr, Po p" ), y el movimiento tiene lugar 
en la dirección del vector (p”, po, Pp ”) con la velocidad 


A == MH YP" == CO, (32) 


donde v' es la velocidad de la partícula correspondiente al momento 
(pr, p' E p") dada por la fórmula (26). Es fácil ver que las ecuaciones (30), 


(31) y (32) se verifican en todos los sistemas de referencia de Lorentz, pues 
de hecho, la expr esión del segundo miembro de (29) es un invariante rela- 
tivista, siendo p”, po p' y H' las componentes de un cuadrivector. Estas 


propiedades de invariancia relativista condujeron a de Broglie, antes del 
descubrimiento de la mecánica cuántica, a postular la existencia de ondas 
de la forma (29) asociadas al movimiento de cualquier partícula. Se cono- 
cen por tanto como ondas de de Broglie. 

En el caso límite cuando se hace tender la masa m a cero, la velocidad 
clásica v de la partícula se hace igual a c, y por tanto, según (32), la velo- 
cidad de la onda también se hace c. Las ondas son semejantes entonces a 
las ondas luminosas asociadas a un fotón, con la diferencia de que no con- 
tienen información alguna sobre la polarización, y que llevan consigo un 
exponencial complejo en vez de senos y cosenos. Las fórmulas (30) y (31) 
siguen siendo válidas y relacionan la frecuencia de las ondas luminosas 
con la energía del fotón y la longitud de onda de las ondas luminosas con 
el momento del fotón. 

Para el estado representando por (29), la probabilidad de encontrar la 
partícula en cualquier pequeño volumen cuando se lleva a cabo una obser- 
vación de su posición es independiente del lugar en que se encuentra el 
volumen. Esto proporciona un ejemplo del principio de incertidumbre de 
Heisenberg, ya que se trata de un estado para el cual el momento está dado 
con toda exactitud y para el cual, en consecuencia, la posición está comple- 
tamente indeterminada. Un tal estado es, desde luego, un caso límite que 
no Ocurre nunca en la práctica. Los estados que comúnmente encontramos 
en la práctica son los representados por paquetes de ondas, que se pueden 
construir por la superposición de un conjunto de ondas del tipo (29) perte- 
necientes a valores ligeramente diferentes de (pr, po p” ), como vimos en 


S 24. La fórmula ordinaria en hidrodinámica de la velocidad de un tal 
Aa de ondas, es decir, la velocidad de grupo de las ondas, es 
dy 


d(1/N) 





(33) 
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que, según (30) y (31), da 
dH' d op" 


= ( — (m?*0? + PB —= _==0 4 
dP' dp" pd Hg' (64) 





Ésta es precisamente la velocidad de la partícula. El paquete de ondas se 
mueve en la misma dirección y con la misma velocidad que la partícula 
en mecánica clásica. 


81. Movimiento de paquetes de ondas 


El último resultado que hemos deducido para una partícula libre cons- 
tituye un ejemplo de un principio más general. Para todo sistema con 
análogo clásico, los estados para los que la mecánica clásica constituye una 
aproximación válida están representados en mecánica cuántica por paque- 
tes de ondas, para los cuales todas las coordenadas y momentos tienen 
aproximadamente valores numéricos determinados, cuyo grado de deter- 
minación viene limitado por el principio de incertidumbre de Heisenberg. 
Pero la ecuación de Schródinger determina cómo varían con el tiempo 
dichos paquetes de ondas, y para que la mecánica clásica siga siendo una 
descripción válida es necesario que el paquete de ondas conserve la forma 
de paquete de ondas y que se mueva según las leyes de la dinámica clásica. 
Vamos a comprobar que es así. 

Sea un sistema dinámico que tenga un análogo clásico, y sea H(q,, p») 
(r = 1, 2, ..., n) su hamiltoniano. El sistema dinámico clásico correspon- 
diente tendrá el hamiltoniano H.(q,, p,) que se obtiene sustituyendo las 
Qr y Pr de H(q,, pr) por variables algebraicas ordinarias y haciendo que 
h >0 si es que interviene en H(q,, p,). Es evidente que el hamiltoniano clá- 
sico H. ha de ser una función real de sus variables. Generalmente es una 
función cuadrática respecto a los momentos p, pero no siempre (la teoría 
relativista de una partícula libre es un ejemplo de ello). La demostración 
que vamos a dar a continuación es válida para cualquier función algebraica 
H. de las p,. 

Supondremos que la función de onda dependiente del tiempo en la re- 
presentación de Schródinger es de la forma 


p(qt) = Aetó/n, | (35) 


donde A y $ son dos funciones reales de las q, y de t que no varian muy 
rápidamente. Así pues, la función de onda tiene forma de ondas cuya am- 
plitud y fase son respectivamente A y S. La ecuación de onda de Schródin- 
ger (7) da 


in 2 
Ot 





Aeis/n> — H(q,, p/JAeiS/2> 
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o bien 


BA OS | | 
¿24 _428_1) — esmBla, pNAes/n>. , 
fo > p (Qr, pH Aets/n > (36) 


Evidentemente e7*5/2> es un operador lineal unitario que puesto en lugar 
de U en la ecuación (70) de $ 26 nos determina una transformación unita- 
ria. Las q» permanecen invariantes en dicha transformación; cada p, se 
transforma con ayuda de (31) de $ 22 en 


e t/tp,eSIt = Pr + 0S/0r, 
y H se transforma en 
e745/nH(q,, pyjeS/t = H(q», p- + 08/0q»), 


puesto que las relaciones algebraicas se conservan en la transformación. 
Por tanto (36) se convierte en 


y OA OS OS 


Supongamos ahora que f puede considerarse pequeña, y despreciemos los 
términos en que figure fi en (37). Debemos despreciar entonces en (37) 
las p, que figuran en H, pues cada p. equivale al operador —ihñ0/0q, apli- 
cado a las funciones de las q, que figuran a la derecha. Los términos res- 
tantes nos dan 


9S as 
—L = Hol qu E-1. 
Ot (1 04 r (88) 


Ésta es una ecuación diferencial que debe verificar la función de fase $. 
La ecuación está determinada por la función de Hamilton clásica H., y en 
la dinámica clásica se conoce con el nombre de ecuación de Hamilton- 
Jacobi. Admite soluciones reales para S, y por tanto, la hipótesis de la 
forma ondulatoria de (35) no nos lleva a ninguna contradicción. 

Para obtener una ecuación en que figure A, hemos de conservar en (37) 
los términos lineales en hi y ver qué se obtiene con ellos. El cálculo directo 
de dichos términos en el caso de una función H general es bastante difícil, 
y para obtener el resultado que buscamos resulta más fácil multiplicar 
ambos miembros de (37) por el bra <Af, donde f es una función real de 
las q, arbitraria. Así resulta 


1 2A ¿05 
E Er ot 


OS 
| ¡ E 0qe 
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La ecuación compleja conjugada de ésta es 


24810, _ (7 Ss 
ei > |? = AH (90 Pr +=, 18. 


Restándolas y dividiendo por ih obtenemos 
JÁ OS 
2XA ? — <A > r 
q A ls Hs Pp a lo. (39) 


Tenemos que calcular el P.B. 
$e H(9,, Pr + 0S/2qr)]. 


La hipótesis de que puede ser considerada pequeña nos permite desarro- 
llar H(qr, pr + 08/0q1) en serie de potencias de las p,. Los términos de 
orden cero no contribuyen al valor del P.B. La forma más cómoda de cal- 
cular la contribución de los términos de primer orden en las p, al valor 
del P.B. es utilizar la fórmula clásica (1) del $ 21 (dicha fórmula es válida 
también en la teoría cuántica cuando u es independiente de las p, y v es 
lineal en las p,). La contribución total es 


Y ó6f | 0H(q+, pr) 
| ¡e 


s 09» op $ 


donde el corchete con subíndices significa que hemos de sustituir, en la 
función de las q, y las p,, que figura dentro, cada p, por 95/2q+, con lo cual 
obtenemos una función únicamente de las q,. Los términos de órdenes 
superiores en las p, dan una contribución al valor del P.B. que para h —>0 
se anula. Luego, despreciando los términos en que figura Á en (39), que 
equivale a despreciar hi? en (37), (39) se convierte en 


DA A Of | 0H dq», pr) 
RS = <A A a >. (40) 


Por otro lado la fórmula (64) de $ 20 nos da para a(q) y b(q) dos funciones 
de las q, cualesquiera 


cab) = | algrag b(g”, 


b 
<a(q) =D E A (41) 
qr 0qr 


de donde 








siempre que a(q) y b(q) verifiquen unas condiciones de contorno adecua- 
das tales como las que discutimos en $$ 22 y 23. Luego, (40) se puede 
escribir 
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E) - a 2 9 ba q dqr, pr) ¡A bo. 





OP, 
Puesto que esto es válido para toda función real f, se tiene 
LA 0H q», pr) | 
CN e E Pr=95S/0qr y (42) 


Ésta es la ecuación que debe satisfacer la amplitud A de la función 
de onda. Para comprender su significado, consideremos un fluido que se 
mueve en el espacio de las variables q, cuya densidad en cualquier punto 
de espacio sea igual a A* y cuya velocidad sea 





dqs  [ 0H.g», p») (43) 
de 0Ps dci 


En esta imagen, la ecuación (42) es precisamente la ecuación de conser- 
vación del fluido. El movimiento del fluido está determinado por la fun- 
ción S que verifica (38), y para cada solución de (38) existirá un eno 
movimiento. 

Para una S dada consideremos una solución de (42) para la cual, en 
un instante inicial dado, la densidad A? sea nula en todo el espacio exterior 
a una pequeña región. Podemos suponer que dicha región se mueve si- 
guiendo al fluido, es decir, con una velocidad dada por (43), y entonces 
la ecuación de conservación (42) exigirá que la densidad fuera de dicha 
región sea siempre nula. Existe un límite inferior del tamaño de dicha re- 
gión, que viene impuesto por la aproximación que hemos hecho al despre- 
ciar 4 en (30). Dicha aproximación es válida únicamente si 

h A < 
0Qr 09» 


1 ¿A 1 oS 
da 7 QA 
A q» ñh 0Qr 








O sea si 








que exige que al variar las q,, A no varíe en una fracción apreciable de sí 
misma en un intervalo en el que S no haya variado en muchas veces %h, es 
decir, en un dominio de anchura superior a muchas longitudes de onda 
de la función de onda (35). Si se verifica dicha condición, la solución con- 
siderada es un paquete de ondas del tipo estudiado en $ 24, y sigue sién- 
dolo durante todo el tiempo. 

Hemos obtenido así una función de onda que representa un estado de 
movimiento para el cual las coordenadas y los momentos tienen aproxima- 
damente valores numéricos determinados durante todo el tiempo. Tales 
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estados de movimiento de la mecánica cuántica corresponden a los estados 
que considera la teoría clásica. El movimiento del paquete de ondas está 
determinado por las ecuaciones (38) y (43). De ellas, definiendo p, igual 
a 05/04, obtenemos 




















dp, d OS a%s OS  0qu 
a A 
dt dt 29. 0tOQs a EqueédGs di 
9 CS 0%S — 0H LQr, Pr 
E H. dr> : Ny PO o 
00 s 09r n=  09409s OPu 
0H. F> F 
_ _ 0Hdqr pr) (44) 
09 s 


en donde en la última línea las q, y las p, las hemos considerado indepen- 
dientes antes de la derivación parcial. Las ecuaciones (43) y (44) coinciden 
con las ecuaciones de movimientos clásicas puestas en forma de Hamilton 
e indican que el paquete de ondas se mueve según las leyes de la mecánica 
clásica. Vemos así cómo pueden deducirse las ecuaciones del movimiento 
clásicas como caso límite a partir de la teoría cuántica. 

Mediante una solución más exacta de la ecuación de onda puede demos- 
trarse que el grado de precisión con que pueden atribuirse simultáneamente 
valores numéricos a las coordenadas y momentos no puede permanecer 
constantemente en el límite permitido por el principio de Heisenberg 
— ecuación (36) de $ 24 — y que si inicialmente ocurre así, en el transcurso 
del tiempo irá disminuyendo y el paquete de ondas se irá deformando.! 


32. El principio de acción + 


La ecuación (10) nos dice que las variables dinámicas de Heisenberg 0s 
en el instante t, están ligadas con sus valores 0; o 0 en el instante to, a tra- 
vés de una transformación unitaria. Las variables dinámicas de Heisen- 
berg en el instante t + 3t están ligadas con sus valores en el instante t a 
través de una transformación unitaria infinitesimal como muestra la ecua- 
ción de movimiento (11) o (13), que relaciona 0... y v¿ en la forma (79) 
u (80) de $ 26 con H, en lugar de F y 3t/A en vez de e . Por tanto, la varia- 
ción con el tiempo de las variables dinámicas de Heisenberg puede ser 
considerada como el desarrollo continuo de una transformación unitaria. 


”— CT e 


ft Véase KENNARD, Z. f. Physik, 44 (1927), 344; Darwin, Proc. Roy. Soc. A, 
117 (1927), 258. 

F Esta sección puede ser omitida por el estudiante que no esté especialmente inte- 
resado en dinámica superior. 
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En mecánica clásica las variables dinámicas en el instante t + 3t están 
relacionadas con los valores en el instante ¿ mediante una transformación 
de contacto infinitesimal, y el movimiento global puede ser considerado 
como el desarrollo continuo de una transformación de contacto. Éste es el 
fundamento matemático de la analogía entre las ecuaciones del movi- 
miento clásicas y cuánticas, y podemos desarrollarlo a fin de descubrir el 
análogo cuántico de todos los principales rasgos característicos de la teoría 
clásica de la dinámica. 

Sea una representación en la que el conjunto completo de observables 
que conmutan E sea diagonal, siendo por tanto los bras básicos <8'|. Pode- 
mos introducir una segunda representación cuyos bras básicos sean 


de <8ET. E (45) 


Los nuevos bras básicos son función del tiempo t y forman una represen- 
tación móvil análoga a un sistema de referencia móvil en un espacio vecto- 
rial ordinario. Comparando (45) con la conjugada imaginaria de (8), vemos 
que los nuevos vectores básicos son precisamente los transformados en la 
imagen de Heisenberg de los vectores básicos originales de la imagen de 
Schródinger y, en consecuencia, estarán ligados a las variables dinámicas 
de Heisenberg o; del mismo modo que los vectores básicos de partida lo 
están a las variables dinámicas de Schródinger v. En particular cada <E**| 
ha de ser un autovector de los E; perteneciente a los autovalores £”. Por 
tanto, podremos escribirlo <8'l, sobreentendiendo que los números E” son 


los mismos autovalores de los Es que los E” son de los ¿. De (45) resulta 
<ENE> = <ETIE”, (46) 


que nos dice que la función de transformación coincide con el representante 


de T en la representación original. 
Diferenciando (45) con respecto a t y empleando (6), con ayuda de (12), 


resulta 


E: AR 
ES = dEl = BT = ENT 


Multiplicando a la derecha por un ket ja) cualquiera que no sea función 
de t, resulta 


] d p _ , 0 , ” 14 174 
mÍ ej = «Emp = | EH ES dE O, am 


donde para concretar hemos considerado el caso en que los autovalores de 
las £ son continuos. Por otro lado, la ecuación (5) escrita en forma de 
representantes es 


mc = | <ElHE" de <ETPO, (48) 
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Como <8'(H/8”> es la misma función de las variables E”, y ás que <£ 1H ¿”> 
es de las E y Er, las ecuaciones (47) y (48) son exactamente de la misma 
forma; las le E, 5, de (47) juegan el papel de las variables £* y E” 
de (48), y la función <E a) el de la función <g£'|Pt>. Así pues, pet 
considerar (47) como una forma de la ecuación de onda de Schródinger 
con la función de onda <8'|a> de las variables £'. De este modo la_ecua- 
ción de onda de Schródinger aparece bajo otro aspecto, como la condición 
que han de verificar los representantes de los kets fijos que corresponden 
a los estados en la imagen de Heisenberg, en la representación móvil en la 
que las variables de Heisenberg E, son diagonales. La función <¿'la> debe 
su variación temporal al factor de la izquierda <E, |, contrariamente a lo 
que ocurre con la función <E'“Pt>, cuya variación temporal es debida al 
factor de la derecha |Pt£>. 
Poniendo ja> = |£”> en (47) resulta 


185 — j ELE E de” 160), (49) 





que demuestra que la función de transformación <£'|£”> verifica la ecua- 
ción de onda de Schródinger. Pero Es, = É, y por tanto 


SEL 187) = 8(E —E", (50) 


donde, igual que en el segundo miembro de (34) de $ 16 con las variables 
Ev+1) -»>:> Eu, la función $ debe entenderse como el producto de un conjunto 
de factores, uno para cada variable E. Luego, la función de transformación 
<£/18”> es aquella solución de la ecuación de onda de Schródinger para la 
cual en el instante to las € tienen con certeza los valores E”. El cuadrado 
de su módulo, |<E'12”) [?, es la probabilidad relativa de que las E tengan 
los valores £' en dl instante t > to si en el instante ty tenían con certeza los 
valores E”. Podemos escribir <é¿[87> en lugar de <£/18”> y considerar 
que dependa no sólo de t sino también de to. Para hallar la dependencia 
de to tomamos la ecuación compleja conjugada de (49) intercambiando t y t 
y las primas con las segundas. Así resulta 





de) «EE de” «EH, (>. (51) 


La discusión precedente relativa a la función de transformación 
<615”> es válida para cualquier conjunto completo de observables que 
conmuten £. Hemos escrito las ecuaciones para el caso en que las E tengan 
autovalores continuos, pero haciendo los cambios formales necesarios, 
dichas ecuaciones seguirán siendo válidas para el caso de que cualquier 
subconjunto de las £ tenga autovalores discretos. Consideremos ahora un 
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sistema dinámico que tenga un análogo clásico y tomemos como E las 
coordenadas q. Hagamos 


<qg”> = ess (52) 


que nos define la función S de las variables q”, g”. Dicha función depende 
también explícitamente de t. (52) es una solución de la ecuación de onda 
de Schródinger y si Á se puede considerar pequeña, podemos tratarla 
del mismo modo que hicimos con (35). La S que figura en (52) es distinta 
de la S de (35), pues en (52) no figura la A, y en consecuencia, la $ de (52) 
será compleja; pero la parte real de $ será igual a la S de (35), y la parte 
imaginaria será del orden de %h. Luego, en el límite, cuando A= 0, la S 
que figura en (52) será igual a la de (35), y en consecuencia habrá de veri- 
ficar la ecuación correspondiente a (38). 


—08/%t = H (q, PJ (53) 


donde . 
Pp”, = 0S/0q”., (54) 


y siendo H, el hamiltoniano del análogo clásico de nuestro sistema dinámi- 
co cuántico. Pero (52) también es solución de (51) puesta en función de 
las q en vez de las E, ecuación que es compleja conjugada de la ecuación 
de onda de Schródinger en las variables q” o gq: Por ello S habrá de 
verificar * también : 
oS/0t_ = H (g”, p”), (55) 
donde 
p" = —058/0q. (56) 


La solución de las ecuaciones de Hamilton-Jacobi (53), (55) es la función 
de acción de la mecánica clásica para el intervalo to a t, es decir, la integral 
respecto al tiempo del lagrangiano L, 


Ss = | Lv) de (57) 


Luego, la S definida por (52) es el análogo cuántico de la función de 
acción clásica, y en el límite h > 0, es igual a ella. Para hallar el análogo 
cuántico del lagrangiano clásico, consideremos un intervalo de tiempo 
infinitesimal, y pongamos t = to + 3t, de donde resulta que <g%, .., 19;/> 
es el análogo de eL (t019*/%. Para los fines de la analogía, en lugar de conside- 
rar L(to) como una función de las coordenadas y de las velocidades en el 





i Para una comparación más cuidadosa de las funciones de transformación con la 
mecánica clásica, véase Van VueEckK, Proc. Nat. Acad., 14, 178. 
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instante to, como se suele hacer generalmente, debería considerarse como 
una función de las coordenadas q” en el instante to + 8t y de las coordena- 
das q” en el instante fo. 

El principio de mínima acción de la mecánica clásica dice que la función 
de acción (57) es estacionaria para pequeñas variaciones de la trayectoria 
del sistema que no cambian los puntos extremos, es decir, para pequeñas 
variaciones de las q en todos los instantes intermedios entre to y t que 
dejen fijas q,, y q:. Analicemos qué es lo que corresponde a dicho principio 
en la teoría cuántica. 

Pongamos 


t, 


exp< d ] Lít) dt/hi = exp(iS(t», .)/hy = BÍto, ta), (58) 


£ 


donde B(t;, t¿) corresponderá a <q. ' lg” > de la teoría cuántica. (Aquí q, y 
] a a 
q, pueden designar autovalores de q, y q: distintos, pues así evitamos 
a y 


tener que introducir un gran número de primas en el análisis.) Considere- 
mos el intervalo de tiempo to >t dividido en un gran número de pequeños 


intervalos ty >t1, ty >t3, ..., tm-1 >tm, tm >t, que conseguimos introdu- 
ciendo una sucesión de instantes intermedios t;, ta, ..., tm. Entonces 
Bt, to) = Bt, tm) Bltm, tm-1) -.. Blta, t1) Blt;, to). (59) 


La ecuación cuántica que corresponde a ésta, y que se deduce de la pro- 
piedad (35) de $ 16 de los vectores básicos, es 


«aq =$! ... | <9.a,> dq <q.g, > dq 


. sE mr” 
0 > de <q lg, (60) 
donde para abreviar hemos escrito q, en lugar de q”, . A primera vista no 


parece que exista ninguna correspondencia estrecha entre (59) y (60). Sin 
embargo, analicemos con más cuidado el significado de (59). Cada factor B 
es una función de las q correspondientes a los dos extremos del intervalo 
a que hace referencia. Con ello, el segundo miembro de (59) es una función 
no sólo de q; y de q+,, sino también de todas las q intermedias. La ecua- 
ción (59) es válida únicamente si sustituimos las q intermedias que figuran 
en el segundo miembro por sus valores en la trayectoria real, si bien 
pequeñas variaciones en ellas dejan estacionaria a S, y en consecuencia, 
según (58), también a B(t, to). Lo que corresponde a las integraciones para 
todos los valores de las q” intermedias de (60) es el proceso de sustituir estos 
valores en las q intermedias. Así pues, el análogo cuántico del principio de 
acción queda incluido en la ley de composición (60), y la exigencia clásica 
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de que los valores de las q intermedias hagan a S estacionaria corresponde 
a la condición en mecánica cuántica de que todos los valores intermedios 
de las q” tienen importancia en relación con su contribución a la inte- 
gral (60). 

Veamos en qué forma (59) puede ser considerada como un caso límite 
de (60) cuando f es pequeño. Hemos de suponer que el integrando de (60) 
es de la forma e*F/%, donde F es una función de 9, : 7 ÓN e q que 
cuando Á tiende a cero sigue siendo continua, y por tanto cuando hÁ 
es pequeño, el integrando es una función que oscila rápidamente. La 
integral de una función que oscila rápidamente será muy pequeña, 
salvo las contribuciones que provengan de una región del dominio 
de integración donde para variaciones comparativamente grandes de las q/, 
F varíe relativamente poco. Tal región tiene que ser el entorno de un 
punto en el cual F sea estacionaria para pequeñas variaciones de Q”,. Luego, 
la integral (60) está determinada principalmente por el valor del integrando 
en un punto en el que el integrando es estacionario para pequeñas varia- 
ciones de las q” intermedias, y en consecuencia (60) se transforma en (59). 

Las ecuaciones (54) y (56) expresan que las variables q”, p' están liga- 
das a las q”, p” por una transformación de contacto, y constituyen una de 
las formas características de escribir las ecuaciones de una transformación 
de contacto. Existe una forma análoga de escribir las ecuaciones de una 
transformación unitaria en mecánica cuántica. De (52), con ayuda de (45) 
de $ 22, obtenemos 


os(q; q”) 
07: 





<q ip 1g”> = —ih <qug"> = <q q”. (61) 


rt 


Análogamente, con ayuda de (46) de $ 22, resulta 
0S(q q”) 
09, 





A ras le <qgr>. (62) 

” 0d, *' 
Según la definición general de función de un conjunto de observables que 
conmutan, tenemos 


<q ft )ealq”> = fqnelg")<g;1q”> (63) 


donde f(q:) y g(q) son funciones respectivas de las q; y de las q. Sea 
G(q+ q) cualquier función de las q; y de las q de la forma de suma o 
integral de términos del tipo f(q)g(9), de modo que todas las q; que figuran 
en G estén a la izquierda de las q. Las funciones que satisfagan esta con- 
dición diremos que están bien ordenadas. Aplicando (63 a cada uno de los 
términos de G y sumando o integrando, obtenemos 


<q 1G(q, q)q> = Glq; q)<q,1q>. 


-, 
E a . 
Ai IET 
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Ahora supongamos que cada una de las p,: y de las p, puede ser expresada 
como función bien ordenada de las q; y las q, y escribamos dichas funcio- 
nes Pri(qs q), Pr(q1 q). Si en lugar de G ponemos dichas funciones, resulta 


<q ip, 1g"> = Prldi IG gr? , 
<q ip q”"> = pq, q<qig”> 


Comparando estas ecuaciones con (61) y (62) respectivamente, vemos que 


( , E) 059, q”) ( , 11) pe 059, q) 
OS A E Tar > Pr) 7) = 09 
Lo que significa que 
0S(q+, OS(qs, 
o A (64) 
09 rt 0Qr 


donde los segundos miembros de (64) han de estar expresados como fun- 
ciones bien ordenadas. 

Estas ecuaciones son de la misma forma que (54) y (56), pero se refie- 
ren a las variables cuánticas q; q que no conmutan y no a las variables 
algebraicas ordinarias q”, q”. En ellas vemos hasta qué punto las condi- 
ciones para que una transformación entre variables cuánticas sea unitaria 
son análogas a las condiciones para que unas variables clásicas estén liga- 
das por una transformación de contacto. Sin embargo, la analogía no es del 
todo completa puesto que la S clásica tiene que ser real y, en cambio, no 
existe ninguna condición sencilla para obligar a que la S de (64) también 
lo sea. 


83. El conjunto de Gibbs 


Hasta ahora hemos supuesto siempre que nuestro sistema dinámico está 
en un estado definido en cada instante de tiempo, o lo que es lo mismo, 
que su movimiento está especificado tan exhaustivamente y con tanta pre- 
cisión como ello sea posible sin infringir los principios generales de la 
teoría. En la teoría clásica esto significaría, desde luego, que cada una de 
las coordenadas y de los momentos tendría un valor determinado. Ahora 
bien, podemos interesarnos por un movimiento que no sea conocido con la 
máxima precisión posible. En esta sección consideremos los métodos que 
deben emplearse en este caso. 

En mecánica clásica el procedimiento consiste en introducir lo que se 
denomina un conjunto de Gibbs, cuya idea es la siguiente. Consideramos 
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todas las coordenadas y momentos dinámicos como coordenadas cartesianas 
de un cierto espacio que llamamos espacio de las fases, cuyo número de 
dimensiones será dos veces el número de grados de libertad del sistema. 
Todo estado del sistema puede ser representado por un punto de dicho 
espacio. Dicho punto se moverá de acuerdo con las ecuaciones del movi- 
miento clásicas (14). Pero supongamos ahora que no sabemos en qué estado 
está en cada instante de tiempo, sino solamente que está en uno u otro 
de un conjunto de posibles estados de acuerdo con una ley probabilística 
conocida. Podríamos representarlo mediante un fluido en el espacio de las 
fases, para el que la masa contenida en un volumen cualquiera del espacio 
de las fases fuera igual a la probabilidad total de que el sistema estuviera 
en un estado cuyo punto representativo estuviera comprendido en el inte- 
rior de dicho volumen. Cada partícula de fluido se movería de acuerdo con 
las ecuaciones de movimiento (14). Si introducimos la densidad p del fluido 
en cada punto como la probabilidad por unidad de volumen del espacio 
de las fases de que el sistema esté en un estado cuyo punto representativo 
está en el entorno del punto considerado, obtendremos la ecuación de con- 


servación 
Ot =—2 0q Ne di a “di 


2! O oH | oH ) 
TES en E Js A 
E al Op, OP, qr 


= —[p, H]. (65 














que puede ser considerada como la ecuación de movimiento del fluido, pues 
determina la densidad p en cualquier instante si conocemos la densidad p 
inicialmente como función de las q y de las p. Salvo el signo menos, esta 
ecuación es de la misma forma que la ecuación de movimiento ordinaria (15) 
para una variable dinámica. 

Al exigir que la probabilidad total de que el sistema esté en algún 
estado sea igual a uno obtenemos una condición de normalización para p 


j | p dqdp = 1, (66) 


donde la integración está extendida a todo el espacio de las fases y donde 
dq y dp simbolizan el producto de todos los dq y de todos los dp. Si £ es 
una función cualquiera de las variables dinámicas, el valor medio de £ será 


| J Be dgdp. (67) 


Si en lugar de la densidad considerada tomamos una pg que difiera de la 
anterior en un factor k positivo y constante, la teoría no cambia más que de 
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forma trivial, pero en cambio nos facilita la interpretación. En lugar 
de (66) tendremos ahora 


ff. dgdp = k. 


Con esta nueva densidad la imagen del fluido puede ser un conjunto de k 
sistemas dinámicos similares, cada uno de los cuales se mueve independien- 
temente en el mismo espacio, sin ninguna perturbación o interacción mutua. 
La densidad en cualquier punto será igual al número probable o promedio 
de sistemas en el entorno de cualquier estado por unidad de volumen del 
espacio de las fases, y la expresión (67) representará el valor medio total 
de £ para todos los sistemas. Tal conjunto de sistemas dinámicos, que cons- 
tituye el llamado conjunto de Gibbs, generalmente sólo se puede realizar en 
la práctica como aproximación grosera, pero de todos modos constituye una 
abstracción teórica muy útil. 

Veremos que existe una densidad p correspondiente en mecánica cuán- 
tica, que tiene propiedades análogas a la anterior. Fue introducida por 
primera vez por von Neumamn. Su existencia es bastante sorprendente si se 
tiene en cuenta que el espacio de las fases no tiene ningún significado en 
mecánica cuántica, ya que no hay ningún modo de asignar simultánea- 
mente valores numéricos a las q y a las p. 

Consideremos un sistema dinámico que en un cierto instante esté en 
uno u otro de un conjunto de posibles estados de acuerdo con una ley 
probabilística conocida. Dichos estados pueden constituir un conjunto dis- 
creto o bien un conjunto continuo o ambas cosas a la vez. Para concretar 
consideraremos el caso de un conjunto discreto que supondremos nume- 
rado por un parámetro m. Sean ¡m> los kets normalizados correspondientes 
a dichos estados, y Ps la probabilidad de que el sistema esté en el estado 
m-ésimo. Definimos entonces la densidad cuántica p por 


p = 2 ¡m>Pn<m). (68) 


Sea p” un autovalor cualquiera de p y 19 un autoket perteneciente a dicho 
autovalor. En ese caso 


> im>Pn<mlp> = ple > = ple 


y por tanto 
Y <p [m>Pp<mlp> = p'<ptlp> 


o sea 
2, Po] <mip> P = <p lp>. 


10. — CUÁNTICA 
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Pero como P,, es una probabilidad no puede ser negativa. Por tanto, p” no 
puede ser negativo. Luego p no tiene ningún autovalor negativo, análoga- 
mente a lo que ocurre con la densidad clásica p que no es nunca negativa. 

Hallemos la ecuación de movimiento para la densidad cuántica p. En la 
imagen de Schródinger los kets y bras de (68) variarán con el tiempo de 
acuerdo. con la ecuación de Schródinger (5) y su conjugada imaginaria, en 
tanto que las P,, permanecerán constantes, pues mientras el sistema perma- 
nezca inalterado no puede pasar de un estado correspondiente a un ket 
que verifica la ecuación de Schródinger a otro estado correspondiente a 
otro. En consecuencia, 


do y d|im> d<m)| | 

h -— ih Po Pr Í 

“a 4 O a e 
= Y (Him>P, <m| — Im>P,,<m|H) 


Ésta es la análoga cuántica de la ecuación del movimiento clásica (65). 
La p cuántica, igual que la clásica, está determinada en todo instante si se 
conoce su valor inicial. | 
Según la hipótesis de $ 12, el valor esperado de cualquier observable 8 
cuando el sistema está en el estado m es <m|8|m>. Por tanto, si Pm es la ley 
de probabilidad de que el sistema esté en los distintos estados m, el valor 
esperado de 8 será > P.<m/glm>. Introduciendo una representación que 











tenga un conjunto de kets básicos |£”> discreto, esto equivale a 
Y Pnsmi5/><EBlm> = Y <E1Bim>PnimE"> 
mer ¿Mm 
= Y <ElBoE”> = Y <E TABLE, (70) 
E ES 


siendo el último paso fácilmente comprobable con la ley de multiplicación 
de matrices, ecuación (44) de $ 17. Las expresiones (70) son las análogas de 
la (67) de la teoría clásica. Alí donde en mecánica clásica hayamos de 
multiplicar $ por p e integrar dicho producto para todo el espacio de las 
fases, en la teoría cuántica habremos de multiplicar 8 por p en cualquier 
orden, y tomar la suma de los elementos diagonales * de dicho producto 
en una representación. Si en la representación existe un conjunto continuo 
de vectores básicos |£”>, en lugar de (70) tendremos 


| <engozs de = | <Emals> as, (71) 


y entonces en lugar de sumar los elementos diagonales habremos de reali- 


+  N. del T.: La suma de todos los elementos diagonales de una matriz se denomina 
traza. 
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zar un proceso de “integración a lo largo de la diagonal. Definiremos la 
suma diagonal de f£p en el caso continuo por (71). Se puede comprobar 
fácilmente a partir de las propiedades de las funciones de transforma- 
ción (56) de $ 18, que la suma de los elementos diagonales es igual en todas 
las representaciones. 
De la condición de que los [m> estén normalizados se deduce, para el 
caso de E” discretos 
2 <p> = Y <Elm>Pa<mjE'> = Y Pm = 1, (72) 
¿* ¿om 1% 
pues la probabilidad de que el sistema esté en algún estado es igual a uno. 
Ésta es la ecuación análoga de la (66). La probabilidad de que el sistema 
esté en el estado E”, o la probabilidad de que los observables E que son 
diagonales en la representación tengan los valores £' es, según la interpreta- 
ción de los representantes de un ket (51) de $ 18, 


2 [|< Im> PPm = <E'lp18'>, (73) 


que da significado a cada uno de los términos del primer miembro de (72). 
Para E” continuos, el segundo miembro de (73) da la probabilidad de que 
los E tengan valores en el entorno de £' por unidad de intervalo de varia- 
ción de las E”, 

Igual que en la teoría clásica, podemos considerar una densidad igual 
a k veces la p que hemos definido y decir que representa un conjunto de 
Gibbs constituido por k sistemas dinámicos iguales, entre los que no hay 
perturbación o interacción alguna. Así el último miembro de (72) será igual 
a k, y (70) o (71) nos darán el valor esperado de £ para todos los elementos 
del conjunto, mientras que (73) representará la probabilidad total de que 
un elemento del conjunto tenga unos valores de las E iguales a E”, o en el 
entorno de £* por unidad de intervalo de variación de los valores E”. 

Una aplicación importante del conjunto de Gibbs es su aplicación a un 
sistema dinámico en equilibrio termodinámico cuyo contorno está a una 
temperatura dada T. Gibbs demostró que dicho sistema está caracterizado 
en mecánica clásica por una densidad 


o = coH/tT, (74) 


donde HH es el hamiltoniano, que en este caso es independiente del tiempo, 
Kk es la constante de Boltzmann, y c es un número que se elige de modo 
que se verifique la condición de normalización (66). Esta fórmula puede 
ser tomada a su vez en mecánica cuántica sin ninguna modificación. Para 
altas temperaturas, (74) se reduce a p=cC, que sustituido en el segundo 
miembro de (73) de c<E'1£'> —=c, en el caso de E” discretos. Vemos pues, 
que a altas temperaturas todos los estados discretos son igualmente pro- 
bables. 


vI 


APLICACIONES ELEMENTALES 


34. El oscilador armónico 


Un ejemplo sencillo e interesante de un sistema dinámico en mecánica 
cuántica lo constituye el oscilador armónico. Tiene importancia en la teoría 
general pues es un elemento básico en la teoría de la radiación. Las únicas 
variables dinámicas que se necesitan para describir dicho sistema son una 
coordenada q y su momento canónico conjugado p. En mecánica clásica su 
hamiltoniano es ¡ 


1 
H = — (p? + méntg?), (1) 
2m 


donde m es la masa de la partícula que oscila, y «w es igual a 27 veces la 
frecuencia. Supondremos que en mecánica cuántica es válido el mismo 
hamiltoniano. Este hamiltoniano junto con la condición cuántica (10) de 
S 22 definen completamente el sistema. 
Las ecuaciones del movimiento de Heisenberg son 
Y: = [9 H] = p:/m, 
e (2) 
Pp: = [pi H] = —mu*q». 
Es conveniente introducir la variable dinámica compleja sin dimensiones 
n = (Qmño) *(p + imag). (3) 


Las ecuaciones del movimiento (2) dan 


7% = (2mhño) H(— mu?q: + iop:) = ion: 
Esta ecuación se puede integrar y resulta 
Ti az Yo esa (4) 


donde o es un operador lineal independiente de t, y es igual al valor 
de 7, en el instante inicial £ = 0. Las ecuaciones anteriores son idénticas 
a las de la teoría clásica. 
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Podemos expresar q y p en función de 7 y de su compleja conjugada 7), 
y poner todo en función exclusivamente de las variables 7 y 7. Tenemos 


fon” = (2m) (p+ imoq)lp — imoq) 
= (2m)*[p* + m*w*q* + imo(qp — pq)] 


y análogamente 
horny = H + 3ño. (6) 
Luego, 
m—m = 1. (7) 


La ecuación (5) o (6) expresan H en función de 7 y 7, y (7) da la relación 
de conmutación entre 7 y 7. De (5) resulta 


y de (6) 
horari = Hr + 3h07. 
Luego, 
7¡H—H7 = hon. (8) 
Asimismo, la (7) conduce por inducción a 
ia — 77 =p" (9) 


para todo valor de n entero y positivo, pues multiplicando (9) por 7 a la 
izquierda se obtiene (9) con n+ 1 en lugar de n. 

Sea H' un autovalor de H y sea |H'> un autoket perteneciente a él. 
Según (5) 


ho<H'nqH?> = <H (H —3ho]H"> = (HB — ho)<H1HB'>, 
Pero <H'|nn|H'> es el cuadrado de la longitud del ket 7[H”>, y por tanto, 
<H'ni[H> => 0, 


siendo válido el signo igual sólo cuando 7|H'> = 0. Asimismo, <H'|H> > 0. 
Luego, 
H' > 3ho, (10) 


siendo válido el signo igual sólo cuando 7/H'> = 0. Como H tiene la forma 
de suma de cuadrados (1), es de esperar que sus autovalores sean todos 
positivos o nulos (pues el valor medio de H para cualquier estado tiene 
que ser positivo o nulo). Pero además ahora hemos obtenido una condición 
más restringida (10). 

De (8) resulta 


HN = (HA —honH> = (H'—ho)H>. AD. 
Ahora bien, si H' fo, 7|[H'> es distinto de cero, y según (11) es un 
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autoket de H perteneciente al autovalor H'— Ro. Luego, si H” es cual- 
quier autovalor de H distinto de ¿%o, entonces H' —%how es también auto- 
valor de H. Podemos repetir el razonamiento y deducir que si H' — ho % 
340, entonces también H' — 24 es autovalor de H. Reiterando el pro- 
cedimiento obtenemos la serie de autovalores H', H'—fo, H' — 2ho, 
H' — 3ho, ..., que, como en virtud de (10) no puede extenderse indefinida- 
mente, ha de terminar forzosamente con el valor ¿4w. Asimismo de la 
ecuación compleja conjugada de la (8) resulta 


Hr H"> = (94 + hon H" = (1 + ho)jnH”>, 


que muestra que salvo en el caso de que 7|H'> = 0, H' + ho es otro 
autovalor de H uno de cuyos autokets es 7]|/H'>. La posibilidad de que 
MH'> = 0 puede ser desechada, pues nos conduciría a 


0 = ñomnH?> = (HB 3R00BH> = (H' + ¿hñ0)H">, 


en contradicción con (10). Luego, H' + fiw siempre es otro autovalor de H 
y por tanto también lo son H* 4- 2%0o, H' 4 3hño, etc. Por consiguiente, los 
autovalores de II son la sucesión de números 


Jho, 3ho, Sho, ho, ... (12) 


que se extiende hasta infinito. Éstos son los valores posibles de la energía 
para el oscilador armónico. 
Sea |[0> un autoket de H perteneciente al mínimo autovalor ¿%0; por 
tanto, 
710> = O, (13) 


y formemos la sucesión de kets 
05, 0, FO, FO»... (14) 


Todos ellos serán autokets de H pertenecientes respectivamente a la suce- 
sión de autovalores (12). De (9) y (13) se deduce 


an"10> = ny” 110> (15) 


para todo entero n no negativo. Luego, el conjunto de kets (14) es tal 
que 7 o 7 aplicado a cualquier ket del conjunto da un ket dependiente del 
conjunto. Ahora bien, como todas las variables dinámicas de nuestro pro- 
blema se puede expresar en función de 7 y 7, los kets (14) constituyen 
un conjunto completo (de no ser así, existirían otras variables dinámicas). 
Hay un solo ket del conjunto para cada autovalor (12) de H, luego, H cons- 
tituye por sí solo un conjunto completo de observables. Los kets (14) 
corresponden a los distintos estados estacionarios del oscilador. El estado 
estacionario con energía (n + 3)ho, correspondiente a y"[0>, se denomina 
estado cuántico de orden n. 


4 
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El cuadrado de la longitud del ket 7”[0> según (15) es 
<O|[7*7"10> = n<0|7”"1q"-1]0> 


Por inducción obtenemos 


<0i7"pl0> = n (16) 
si [0> estaba normalizado. Por tanto, los kets (14) multiplicados respectiva- 
mente por los coeficientes n!”*, con n=0, 1, 2, ..., constituyen los kets 


básicos de una representación, a saber, la representación en la que H es 
diagonal. Todo ket |[x> se puede desarrollar en la forma 


> = Y x, 7"/0>, (17) 
Ó 


siendo los x, números. Por este procedimiento el ket |x> está en correspon- 
dencia con una serie de potencias >; x, 7” de la variable 7, donde los dis- 
tintos términos corresponden a los distintos estados estacionarios. Si lx> 
está normalizado, define un estado para el que la probabilidad de que el 
oscilador armónico esté en el estado cuántico de orden n, o sea, de que H 
tenga el valor (n + 3)ho, es | 


P. = ni [xl (18) 


según se deduce del mismo razonamiento que nos condujo a la (51) de $ 18. 

El ket [0> puede ser considerado como un ket standard y la serie de 
potencias de + como una función de onda, pues todo ket se puede expresar 
como dicha función de onda multiplicada por el ket standard. Así obtene- 
mos un tipo de función de onda que difiere de las que utilizamos corriente- 
mente, y que introdujimos en (62) de $ 20, en que es función de una 
variable dinámica compleja $9 y no de un observable. Esta representación 
la utilizó por primera vez por V. Fock, y la llamaremos representación de 
Fock. En muchas aplicaciones es la representación más conveniente para 
describir estados del oscilador armónico. El ket standard |0> verifica la 
condición (13) que sustituye a las condiciones (43) de $ 22 del ket standard 
de la representación de Schródinger. 

Introduzcamos la representación de Schródinger con q diagonal para 
obtener los representantes de los estados estacionarios. De (13) y (3) resulta 


de modo que 


<q/|p — imoq|0> — 0. 
Con ayuda de (45) de $ 22, ésta equivale a 


2 <g/10> + moq'<9/10> = 0. (19) 
2q 
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La solución de esta ecuación diferencial es 
<q 107 = (mo/rh)jero"/2%, (20) 


donde hemos tomado el coeficiente numérico de modo que |0> esté norma- 
lizado. Éste es el representante del estado fundamental, nombre que se da 
al estado de menor energía. Los representantes de los demás estados esta- 
cionarios se pueden deducir a partir de éste. Según (3) tenemos 


<q In"0> = 2mho) "<q (p + imoq)"10> 


| 


E Emo) oe — h Sor + mog' ] “<g0> 
q | 


— ¡"(2mho)"/? (mo/rh) (- th <= + moq ) enrar/2n (91) 
q 


Esta expresión se puede desarrollar fácilmente para pequeños valores de n. 
El resultado es de la forma e”""2”/2% multiplicado por un polinomio de 
grado n en q”. Para que el representante del estado cuántico de orden n 
esté normalizado tenemos que agregar en (21) el factor n!”+, Los factores 
de fase 1” se pueden suprimir. 


35. Momento angular 


Consideremos una partícula caracterizada por sus tres coordenadas car- 
tesianas x, y, 2 y sus tres momentos conjugados Pz, Py, Pz. El momento 
angular respecto al origen se define, igual que en la teoría clásica, por 

My = YP2—ZPy My, = 2ZP2¿—XPa  M, == *Py—YPz, (22) 
o bien por la ecuación vectorial 
m —= XxX p. 


Hemos de calcular los P. B. de las componentes del momento angular con 
las variables dinámicas x, p,, etc., y consigo mismas. El modo más fácil de 
hacerlo es utilizar las reglas (4) y (5) de $ 21. Así 


[m., x] = [xp —ypo 1] = —ylp» 1] = y, | (23, 
[m. y] = [xp —ypa,y] = xlp, y] = —x, 
[m,, 2] = [xp, — Ya, 2] = O, (24) 
y análogamente 
[m, pa] = Py [mp] = —Ps, (25) 


map] ="0: (26) 
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con las relaciones correspondientes para m, y m,. Tenemos además 
[m.. m,] + [zp . 0 *P., m ] — z[p., m,] 2 [x, m_Jp. 


= —2Py + YP: = Ma, | (27) 


[m., m,] = m,, [m,, m,] = m.. / 


Estos resultados son los mismos que en la teoría clásica. Los signos de (23), 
(25) y (27) son fáciles de recordar por la regla siguiente: cuando las tres 
variables dinámicas, es decir, las dos del P.B. de la izquierda y la del 
resultado de la derecha están en permutación circular de (xyz), el signo 
es positivo, y en caso contrario es negativo. Las ecuaciones (27) se pueden 
escribir en notación vectorial 


m Xxm — ifhm. (28) 


Supongamos ahora que existan varias partículas de momentos angulares 
my, Ma, ... Cada uno de estos momentos angulares vectoriales verificará la 
relación (28), o sea, 


m, X m, puna ihm , 


y además cada uno de ellos conmutará con todos los demás, y en conse- 
cuencia 
m, xm, + mxm,=0 (rs). 


Luego si M — > m, es el momento angular total, 


MxXM=2m,xm,=>3m,xm,+ 2 (m,x m,-+ m, Xx m,) 
=ih Y m,= ihM. (29) 


_ 
Este resultado es de la misma forma que (28), y por tanto, las componentes 
del momento angular total M de cualquier número de partículas verifican 
las mismas relaciones de conmutación que el momento angular de una sola 
partícula. 

Sean Az, A,, A; las tres coordenadas o las tres componentes del momento 
de una de las partículas. Las A conmutarán con los momentos angulares de 
las otras partículas, luego según (23), (24), (25) y (26) será 


[M., As] = A,  [M,A,]] =—Az  [M,A.] =0. (30) 


Si Bz, B,, B, es un segundo conjunto de tres cantidades que representan 
las tres coordenadas o las tres componentes del momento de una de las 
partículas, también verificarán relaciones similares a (30). Tendremos en- 
tonces 
[M,, Az B; + Ay B, + A; B;] 

2 [M., As]Bo l Ag[M., B,] E [M., Ay] B, FF Ay[M., B,] 

— A, B.¿ + As B, — As By — Ay Bo 

=0 
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Por tanto, el producto escalar A, B,¿ + A, B, + As B, conmuta con M,, y 
análogamente también con M, y M,. Consideremos el producto vectorial 


AXB=C 
O sea, 


A,B,—A,B, = Ca, A:B,—A,B. = Cy, As B,—A,B¿ = Co. 


Tenemos 

[M., C.] = —AsB,¿+ As Ba = Cy 

y análogamente 
[M,, Cy] = —Co, [M,, C¿] = 0. 


Estas ecuaciones son a su vez de la forma (30) con C en lugar de A. De 
aquí resulta que las ecuaciones (30) son válidas para las componentes de 
cualquier vector que podamos formar a partir de las variables dinámicas, 
y que todo escalar conmuta con M. 

Podemos introducir operadores lineales de rotación R alrededor del 
origen análogamente a como hicimos con los operadores de traslación D 
en $ 25. Para una rotación de ángulo 8p alrededor del eje z, considerando 
$$ como un infinitésimo, obtenemos el operador límite correspondiente a 
64 de $ 25, | 

lim (R— 1)/8%, 

90 
que llamaremos operador de rotación alrededor del eje 2 y designaremos 
por 1, Igual que los operadores de traslación, r, es también un operador 
lineal imaginario puro que está indeterminado en un número aditivo imagi- 
nario. En correspondencia con (66) de $ 25, la variación de primer orden 
de 38$ que experimenta una variable dinámica v al realizar un giro de 
ángulo ¿$ pequeño alrededor del eje z es 


dH(r¿V — Dr). (31) 


Pero las variaciones de las tres componentes Az, Ay y Az de un vector, de- 
bidas a un giro de todos los aparatos de medida en un ángulo 34 (hacia 
la derecha) alrededor del eje z, son respectivamente 8$A,, —8bAs y O, 
mientras que los escalares permanecen invariantes en el giro. Igualando 
estos cambios a (31), resulta 


As ==> Asta —= An "Ay ==” Arz == Az 
As == Asa Ar O, 


y que r, conmuta con cualquier escalar. Comparando estos resultados con 
(30), vemos que ihr, verifica las mismas relaciones de conmutación que M.. 
Luego, su diferencia M¿— ihr, tiene que conmutar con todas las variables 
dinámicas, y por tanto, es un número. Dicho número, que necesariamente 
ha de ser real, pues M, y ¿fir, son ambos reales, puede hacerse igual a cero 
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eligiendo convenientemente el número imaginario puro arbitrario que se 
podía sumar a r,. Entonces resultará 


M, = ihr,. (32) 


Para M, y M, tendremos las ecuaciones correspondientes. Estas ecuaciones 
son análogas a (69) de $ 25. Luego, el momento angular total está asociado 
con los operadores de rotación del mismo modo en que el momento total 
está asociado con los operadores de traslación. Esta conclusión es válida 
tomando el origen en cualquier punto. 

Los razonamientos anteriores son válidos para los momentos angulares 
debidos al movimiento de las partículas, que para cada partícula vienen 
dados por (22). En la teoría atómica interviene otra clase de momento 
angular, que es el momento angular de spin. Al primero se le llama momen- 
to angular orbital para diferenciarlo del segundo. El momento angular de 
spin debe atribuirse a algún movimiento interno de la partícula, pues está 
asociado a grados de libertad distintos de los que intervienen en la des- 
cripción del movimiento de la partícula como un todo, y por tanto, las 
variables dinámicas que representan el spin tienen que conmutar con x, y, 
2, Pa, Py Y Pz Estrictamente, el spin no tiene correspondiente en mecánica 
clásica, y en consecuencia el método de analogía clásica no es conveniente 
para su estudio, Sin embargo, podemos construir una teoría del spin postu- 
lando simplemente que las componentes del momento angular de spin estén 
relacionadas con operadores de rotación del mismo modo que los momentos 
angulares orbitales, Es decir, postulando que la ecuación (32) también sea 
válida para M, igual a la componente z del momento angular de spin de 
una partícula y r, igual al operador de rotación alrededor del eje z relativo 
a los estados de spin de la partícula. Con esta hipótesis, las relaciones de 
conmutación de las componentes del momento angular de spin M con cual- 
quier vector A relativo al spin han de ser de la forma (30), y en conse- 
cuencia, tomando A como el propio momento angular de spin se obtiene 
la ecuación (29) para el spin. Así pues, (29) es válida en general para cual- 
quier suma de momentos angulares orbitales y de spin, y análogamente (30) 
también será válida para M igual al momento angular total orbital y de 
spin y A una variable dinámica vectorial cualquiera. Asimismo la relación 
entre momentos angulares y rotaciones tiene también validez general. 

Como consecuencia inmediata de esta relación podemos deducir la ley 
de conservación del momento angular. Para un sistema aislado, el hamil- 
toniano debe ser invariante frente a las rotaciones en torno al origen, o lo 
que es lo mismo, ha de ser un escalar; por tanto, tiene que conmutar con el 
momento angular alrededor del origen. Luego, el momento angular es una 
constante del movimiento. En este razonamiento el origen puede ser cual- 
quier punto. 

Como segunda consecuencia inmediata podemos ver que un estado con 
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momento angular total nulo tiene simetría esférica. Dicho estado corres- 
ponderá a un ket |S> que verificará 


M.!S> = M,¡S> = M¿S> = 0, 
y, por tanto, 
AS ESO E AS 


Esto indica que el ket |S> es invariante frente a las rotaciones infinitesimales, 
y en consecuencia también frente a rotaciones finitas, ya que éstas se pue- 
den construir a partir de las primeras. Luego, el estado tiene simetría 
esférica. El teorema recíproco de que un estado con simetría esférica tiene 
momento angular total nulo, también es cierto, si bien la demostración ya 
no es tan sencilla. Un estado con simetría esférica corresponde a un ket 
|S> cuya dirección no se modifica por una rotación. Luego, la variación 
de |S> al aplicarle un operador 7,, r, O r, tiene que ser un múltiplo numé- 
rico de |S>, por ejemplo, 


AS ZO AO EOI r4S> = C¿¿S>, 
donde los c son números. Asi obtenemos 


M.¿S> = ifcCalS>, M,S> = ihc,/S>, | 
M¿S> = ihc¿IS>, (33) 


Estas ecuaciones están en contradicción con las relaciones de conmuta- 
. $ . 

ción (29) entre M,, M, y M. salvo si C¿ =C,=C¿= 0, en cuyo caso el 

estado tiene momento angular total nulo. (33) constituye un ejemplo de 
autoket común a los tres operadores lineales M,, M, y M;¿ que no conmutan 
entre sí, y ello sólo es posible si los tres autovalores correspondientes son 
cero. 


36. Propiedades del momento angular 


Hay algunas propiedades del momento angular que se pueden deducir 
sin más de las relaciones de conmutación entre las tres componentes. Tales 
propiedades son válidas tanto para el momento angular orbital como para 
el de spin. Sean m,, m, y m, las tres componentes de un momento angular, 
e introduzcamos la cantidad 8 definida por la ecuación 


B= mM 44m + me. 


Como f£ es un escalar ha de conmutar con m,, M, y M,. Sea un sistema 
dinámico cuyas únicas variables dinámicas sean M,, M, y M,. En ese caso 
f£ conmuta con todos los operadores y, por tanto, ha de ser un número. 
Podemos estudiar este sistema dinámico de forma parecida a cómo hicimos 
con el oscilador armónico en $ 34, 


Eo 


1 
PA ra 


36. PROPIEDADES DEL MOMENTO ANGULAR 157 


Pongamos 


A partir de las relaciones de conmutación (27) deducimos 


Tm = (m,+ im,)(m,—im,)= mi + mi — ¡(mm, — m,m,) 


= B—m+ hm, (34) 
y análogamente 
97 = B—m¿—hm,. (35) 
Luego, resulta 
7mm— = 2hm.. (36) 
Asimismo 
m,7 —7M, = hm, —hm,— —hÁn, (37) 


Supondremos que las componentes del momento angular son observables 
y que, por tanto, m, tiene autovalores. Sea m” uno de ellos y sea [m > un 
autoket perteneciente a dicho autovalor. Según (34) 


<mM.Taim/> = <m | —m + hm_¡m'> = (B—m?+ Aim min >. 


El primer miembro de esta ecuación es el cuadrado de la longitud del ket 
rim > y, por tanto, es mayor o igual que cero. El caso de igualdad se 
tendrá si y sólo si nim> = 0. Luego, 
B— me + ña = 0, 
o bien 
B+4%2 > (m— 34, (38) 
Por tanto, 
B=+iR*>0 
Si definimos el número k por 
kh = (8 +4) = (m + m2 4 m2 + 442), (39) 
con lo cual k>— 3%, la desigualdad (38) se convierte en 
k+3h > |[m —1h] 
o bien | 
k4h>mwm > —k. (40) 
El caso de igualdad se tendrá si y sólo si nm” > = 0. Análogamente, de (35) 
<m |mijim”> = (8 —m? — hm! )<m” [m* >, 


lo que demuestra que 
pm?—thw >0 
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o bien 
k > m 2 —k—hÁ, 
verificándose una igualdad si y sólo si 7]m/> = 0. Esta condición junto 
con (40) nos muestra que k>0 y que 
k>m=>-—k, (41) 
siendo m” =k si 7im!>=0, y m =—k si ym” > =0. 
De (37) 


my im> => (nm — fin) ¡m' > = (m — Am [me > 


Sim +—k, rim'> es distinto de cero y por tanto es un autoket de m. 
perteneciente al autovalor m “—%h. Análogamente, si m' -—h +-—k, m' —2h 
también es autovalor de ma. y así sucesivamente. Así obtenemos la suce- 
sión de autovalores 9”, m' —AÁ, m1 —2%f, ... que en virtud de (41) ha 
de acabar forzosamente, y sólo puede pa con el valor —k. A su vez, 
la ecuación compleja conjugada de (37) 


m_7 [m> = (im + hn) ¡m > = (n + A)7 mí >, 


demuestra que m' +%h es también autovalor de m, salvo si rim”>=0, en 
cuyo caso m” = = k. Reiterando el MECA obtenemos otra sucesión 
de autovalores mM, m +h, mM + 2%, ..., que en virtud de (41) tiene que 
terminar e y sólo puede terminar con el valor k. Podemos con- 
cluir que 2k tiene que ser un múltiplo entero de A y que los autovalores 
de m, son 


k, k—R, k—2%, ... —k+%h, —k. (42) 


Por simetría, los autovalores de m, y m, han de ser los mismos. Todos 
estos autovalores son múltiplos enteros o bien múltiplos impares semiente- 
ros de h, según que 2k sea un mútiplo par o impar de %. 

Sea i[max> un autoket de m, perteneciente al autovalor máximo k, con 
lo que 


rimax>» = O, (43) 
y formemos la sucesión de kets 
¡max>,  Timax>, N?lmax>, ..., 7% lmax>. (44) 


Todos estos kets son autokets de m, pertenecientes respectivamente a la 
sucesión de autovalores (42). El conjunto de kets (44) es tal que al aplicar 
el operador 7% a cualquiera de ellos se obtiene un ket dependiente del 
conjunto (7 aplicado al último da cero) y según (36) y (43) vemos que al 
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aplicar 7) a uno cualquiera de ellos obtenemos también un ket que depende 
del conjunto. Todas las variables dinámicas del sistema que estamos con- 
siderando se pueden expresar en función de 39 y de 7, y por tanto, el 
conjunto de kets (44) es un conjunto completo. Hay un solo ket pertene- 
ciente a cada autovalor (42) de m,, por lo tanto m. constituye por sí solo 
un conjunto completo de observables. 

Es conveniente definir el módulo del vector momento angular m igual 
a k definido por (39) y no igual a £*, ya que los valores posibles de k son 


0, 3h,%A, 3h, 2h, ..., (45) 


hasta infinito, mientras que los de f£* constituyen un conjunto de números 
más complicado. 

Para un sistema dinámico que tenga otras variables dinámicas ade- 
más de m,, M, y M, pueden existir variables que no conmuten con $. En ese 
caso f ya no será un número sino un operador lineal. Para todo momento 
angular orbital (22) ocurrirá esto, pues x, Y, 2, Pe, Py Y Pz NO conmutan 
con $. Supondremos que f£ es siempre un observable, y que por tanto, se 
puede definir (39), utilizando la función raíz cuadrada positiva, que también 
será un observable. Diremos que el k así definido es la magnitud del vector 
momento angular en el caso general. El análisis anterior que empleamos 
para obtener los autovalores de m, sigue siendo válido en este caso si 
sustituimos ¡mí> por un autoket |k'm/> común a los observables que 
conmutan k y m,, resultando que los autovalores posibles de k son los 
números (45), y que para cada autovalor k' de k los autovalores de m, son 
ios números (42) sustituyendo k por k'. He aquí un ejemplo de un fenómeno 
con el que no nos habíamos encontrado anteriormente, a saber, que para 
dos observables que conmutan, los autovalores del uno dependen de qué 
autovalor del otro consideremos. Este fenómeno se puede interpretar como 
que ambos observables no son completamente independientes, sino que 
parcialmente son función uno de otro. El número de autokets independien- 
tes comunes a k y m, que pertenecen a los autovalores k” y m', no ha de 
depender de m',, pues para cada |k'm”,> independiente podemos obtener 
un |k'm”7> también independiente con cualquier valor de m” de la suce- 
sión (42), sin más que multiplicar ¡k'm'”> por una potencia adecuada de 
y O de 7. 

Como ejemplo consideremos un sistema dinámico que posea dos mo- 
mentos angulares m, y m», que conmutan entre sí. Si no existe ninguna otra 
variable dinámica, todas las variables dinámicas conmutarán con las can- 
tidades k, y kz de m,; y mo, luego, tanto k, como kz son números. Sin 
embargo, la magnitud k del momento angular resultante M — m, + ma» no 
es un número (ya que no conmuta con las componentes de m, y de m,) 
y resulta interesante calcular los autovalores de K. El modo más sencillo 
de hacerlo se basa en un procedimiento de contar kets independientes. 
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Hay un solo autoket independiente común a My, y Mo, que pertenezca a un 
autovalor m' , Para cada uno de los valores k,, k,—%R, ki—-2 , +... — K; 
y a un autovalor m', para cada uno de los valores k», k—f, Kk2— 2%, 
..., —ko, y dicho ket es también autoket de M, perteneciente al autovalor 
M' =m'_+m,.. Los valores posibles de M” serán, por tanto, k, + Ko, 
ki + k2—hR, k, + k2 — 2%, ..., — k, — kz, y el número de veces que ocu- 
rrirá cada uno de ellos viene dado por el siguiente esquema (para concretar 
supondremos k, > ko), 


k ko, k¡ +k2—%, ki + k2—2%, .. k —ko,k, —k2—h, ... 
1 2 3 .. ko+1 2k+1 | (46) 
o —k Ek, —k, +ko—h, ...,—ki—Ko | 
2k2 +1 2k., Al 
Ahora bien, para cada autovalor K” de K, M, tendrá los autovalores Ki, 
K'—h, K— 2h, ..., —K y para cada par de autovalores de K y M. exis- 


tirá el mismo número de autokets independientes comunes a K y a M.. 
El número total de autokets de M, independientes que pertenecen a un 
autovalor M” tiene que ser el mismo tanto si los elegimos entre los auto- 
kets comunes a mia y ma, como si los elegimos entre los autokets comunes 
a K y M,, luego, en ambos casos viene dado por el esquema (46). De aquí 
se deduce que los autovalores de K son | 


kk ki+ke—h, ki +ko—2%, .00, ki —ko, (47) 


y que para cada uno de estos autovalores de K y un autovalor de M¿ com- 
patible con él existe un único autoket independiente común a K y a M.. 

Hemos de considerar la acción de las rotaciones sobre los autokets de 
las variables de momento angular. Sea |M'> un autoket cualquiera de la 
componente z del momento angular total de un sistema dinámico general, 
y apliquémosle un pequeño giro de ángulo 84 en torno al eje z. Según (32) 
se transformará en 

(1+36r )1M”> = (1 —ispM_ /h) ¡M”> 


Esto equivale a 
(1—¡pM'A/) ¡M/> = e 72M) 


para el primer orden en 06. Luego |M”> queda multiplicado por el factor 
numérico e-494/8 . Aplicando sucesivamente pequeños giros resulta que 
una rotación de ángulo $ alrededor del eje z transforma a ¡M”> en sí 
mismo multiplicado por e”+*M'/s, Tomando $ = 2x resulta que un giro 
de 27 alrededor del eje 3 deja invariante a [M”> cuando el autovalor M” 
es múltiplo entero de %, y le cambia el signo si M' es múltiplo impar semi- 
entero de 4. Ahora consideremos un autoket ¡K'> de la magnitud del mo- 
mento angular total K. Si el autovalor K' es un múltiplo entero de Ah, los 
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autovalores posibles de M, serán todos múltiplos enteros de Rh, y un giro 
de 27 alrededor del eje z dejará invariante a [K”>. Por el contrario, si K' es 
un múltiplo impar semientero, los autovalores posibles de M, serán todos 
múltiplos impares semienteros de Á, y un giro de 2x en torno al eje z cam- 
hiará el signo de |K”>. Por simetría, un giro de 27 en torno a cualquier eje 
tendrá los mismos efectos sobre |K'> que un giro de 27 en torno al eje z. 
Así llegamos a la conclusión general de que un giro de 2x alrededor de 
cualquier eje deja invariante a un ket o bien le cambia el signo, según 
que pertenezca a autovalores de la magnitud del momento angular total que 
sean múltiplos enteros o múltiplos impares semienteros de h. Desde luego, 
el estado no cambia con el giro de 27, pues un estado sigue siendo el mismo 
aunque cambiemos el signo del ket que lo representa. 

Un ket de un sistema dinámico que sólo posea momentos angulares 
orbitales, tiene que ser invariante frente a un giro de 27 en torno de un 
eje cualquiera, pues para dicho sistema podemos considerar la representa- 
ción de Schródinger en la que las coordenadas de todas las partículas son 
diagonales, y en ella el representante de un ket se transforma en sí mismo 
en dicho giro. En consecuencia, los autovalores de la magnitud de un 
momento angular orbital son siempre múltiplos enteros de h. Asimismo los 
autovalores de las componentes de un momento angular orbital serán 
también múltiplos enteros de % siempre. Para los momentos angulares de 
spin no existe una representación de Schródinger y, por tanto, pueden 
existir ambos tipos de autovalores. 


37. El spin del electrón 


Los electrones así como también otras partículas fundamentales (proto- 
nes, neutrones) tienen un spin cuyo módulo vale +4. Este valor se encontró 
experimentalmente, pero además existen razones teóricas que nos indican 
que tal valor del spin es el más elemental, incluso más que el valor cero 
(véase capitulo XI). Así pues, el estudio de este spin particular es de gran 
importancia. 

Para tratar con un momento angular cuyo módulo vale 4%, es conve- 
niente poner 


m =— hlo. (48) 
Según (27), las componentes del vector a verifican 
Ty U¿— 0704 = 2 0g, 
Cz xr => Sz Sz = Zio,, | (49) 
Eg Ty— Uy Ca = 20,. | 


Los autovalores de m, son 3% y — 3%, luego los de «, serán 1 y —1, y 


11. —- CUÁNTICA 
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o? no tendrá más que un único autovalor que será el 1. Por tanto, s% ha de 
ser igual a 1 y análogamente ha de ocurrir con s? y 0%, 
z y 

=a4=0%=1 (50) 


Y 


Podemos simplificar las ecuaciones (49) y (50) utilizando artificios del álge- 
bra no conmutativa a la que obedecen. Según (50) tenemos 


2 2 
Cy Cz TRAS Sz Sy ms 0 
o bien 
Gy(Sy 02 — 07 0y) + (09 02 — 020y)5y = O 


que, con la ayuda de la primera de las ecuaciones (49), se convierte en 
Too == Us 


Esto quiere decir QUE 07 Oy = — Oy Oz, Dos variables dinámicas o dos opera- 
dores lineales como éstos que salvo el signo negativo verifican la propiedad 
conmutativa de la multiplicación se dice que anticonmutan. Así decimos 
que 9, anticommuta con s,. Por simetría cada una de las tres variables 
dinámicas o, Oz, Sy y 5, anticonmutará con las demás. Las ecuaciones (149) se 
pueden escribir 


Oy Oz = 0% = — 07 0y, 
Cz ee md 10, o Cz Gz, (51) 
a SS 0 0 
y asimismo de (50) 
Sy Cy Te prontos 1. (52) 


Las ecuaciones (50), (51) y (52) son las ecuaciones fundamentales para las 
variables de spin y que representan un spin cuyo módulo es 3%. 
Establezcamos una representación matricial para las variables s en la 
que s, sea diagonal. Si no existe ninguna otra variable dinámica indepen- 
diente en nuestro sistema dinámico más que las m o las s, «, constituye por 
si sola un conjunto completo de observables, pues de la forma de las ecua- 
ciones (50) y (51) inferimos la imposibilidad de construir ninguna variable 
dinámica nueva a partir de 9,, 9, y s, que conmute con 's,. Como los ele- 
mentos de matriz diagonales de la representación matricial de s, han de ser 
sus autovalores 1 y — 1, la matriz será AS 


1 0 
O T 
0 —1 
as da 
d3 Qs 


la matriz que representa a o,. Dicha matriz ha de ser hermítica y, por 


Sea 
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tanto, a, y as han de ser reales, y dz y 43 han de ser números complejos 


conjugados. La ecuación 0,07 = — 0g9¿ NOS da 
dy >) dí —da 
-— lg — Qs ES da —da 
luego a, = as = 0. Por lo tanto, la representación matricial de «o, será 
de forma 
0 da 
d 0 
La ecuación «0? — 1 nos dice que 4243 = 1. Por tanto, como az y 43 son 


números complejos conjugados, han de ser de la forma e** y e”* respec- 

tivamente, siendo « un número real. Así pues, o, estará representada por 

una matriz de la forma | 
0 gu 


Análogamente veríamos que c, también ha de estar representada por una 
matriz de esta forma. Eligiendo convenientemente los factores de fase 
que no están univocamente determinados por la simple condición de que 
s, sea diagonal, podemos hacer que «, esté representada por la matriz 


E 1 
1.0 ) 
El representante de s, viene así determinado por la ecuación s, — 10,5 
Obtenemos finalmente las tres matrices 


(0) + (: 70)» (o —1): 653 


que representan respectivamente a 0, 0, y 0, y que verifican todas las 
relaciones algebraicas dadas por (49), (50), (51) y (52). La componente del 
vector G en una dirección cualquiera dada por los cosenos directores l, m, 
-n, o sea lo, + mo, + na, estará representada por 


n [— im 
54 
l[+im —n (54) 
El representante de un ket constará de dos números, que corresponderán 
a los dos valores 4- 1 y —1 de o”. Dicho par de números constituyen una 
función f¿ (a) cuyo dominio de definición está constituido únicamente 
del par de puntos + 1 y —1. El estado en que cs, tiene el valor uno 


estará representado por la función f,(s/) cuyos valores serán 1, 0, y el es- 
tado en que «, tiene el valor —1 vendrá representado por la función 
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fa (a) cuyos valores serán O, 1. Cualquier par de números se puede expre- 
sar como combinación lineal de los dos anteriores. Así pues, todo estado 
se puede obtener por superposición de los dos estados para los que s, 
toma respectivamente los valores + 1 y —1. Por ejemplo, el estado en el 
cual la componente de s, en la dirección l, m, n, representada por la 
matriz (54), tiene el valor 4 1 estará caracterizado por el par de números 
a y b que verifiquen. 


bis (5) Ñ (;) 


o bien 
na + ([—im)jb = a, 
((+imja—nb — b. 
Por tanto, 
a lim 14m 
as bT l=n l+im 


Este estado puede ser considerado como la superposición de los dos estados 
en los cuales o, es igual a +1 y a — 1, cuyos pesos relativos en la super- 
posición serán 


la? : [b2 = I—im?: (1I—n? =1l+n: l—n. (55) 


Para la descripción completa de un electrón (u otra partícula elemental 
de spin 3%) necesitamos las variables dinámicas de spin s, relacionadas 
con el momento angular de spin a través de (48), junto con las coordenadas 
cartesianas x, y, 3 y los momentos Ps, Py, Pz Las variables dinámicas de 
spin conmutan con dichas coordenadas y momentos. Por tanto, un conjunto 
completo de observables que conmutan para un sistema constituido por un 
único electrón puede ser x, y, 2 y a, En una representación en la que todos 
ellos sean diagonales, el representante de cualquier estado será una función 
de las cuatro variables x”, y”, 2” 6 Como « no puede tomar más que los 
dos valores 1 y — 1, la función de cuatro variables es equivalente a dos 
funciones de tres variables. 


ay zZl>, = <x,4, 2%, +1», <ayz >. = <x,y”,2%,—1l>. (56) 


Así pues, la presencia del spin se puede considerar o bien introduciendo 
una nueva variable en el representante de un estado o bien dando dos com- 
ponentes al representante. 
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ÚS. Movimiento en un campo de fuerzas central 


Un átomo está constituido por un núcleo de gran masa, cargado positi- 
vamente, y un conjunto de electrones que se mueven alrededor de él bajo 
la influencia de las fuerzas de atracción del núcleo y las repulsiones mutuas 
entre ellos. El estudio exacto de este sistema dinámico es un problema 
matemático muy difícil. Sin embargo, se puede obtener alguna luz sobre el 
comportamiento general de todo el sistema haciendo una aproximación 
grosera que consiste en considerar que cada electrón se mueve indepen- 
dientemente en un cierto campo de fuerzas central al que se superpone un 
cierto valor medio de las fuerzas ejercidas por los demás electrones. Así 
pues, el problema del movimiento de una partícula en un campo de fuerzas 
central, que vamos a estudiar ahora, constituye un elemento fundamental 
en la teoría del átomo. 

Sean x, y, z las coordenadas cartesianas de la partícula referidas a un 
sistema de ejes cuyo origen es el centro de fuerzas, y Ps, Py, Pz las compo- 
nentes del momento correspondientes. Despreciando la aproximación rela- 
tivista, el hamiltoniano será de la forma 


1H = 1/2m- (po + p+p2 +V» (57) 


siendo la energía potencial V función únicamente de (4? + y? + 22). Para 
desarrollar la teoría es conveniente introducir variables dinámicas polares. 
En primer lugar, introducimos el radio r mediante la raíz cuadrada positiva 


r= (24+y+2) 


Sus autovalores van desde O hasta «o. Si calculamos sus P. B. con Pa, Py 
y Pz mediante la fórmula (32) de S 22 obtenemos 
Xx 


or 


[7, p] EZ — 


As e 
ex > [r, Py) uE y > [r, Pz] == y > 


que son los mismos que se obtienen en la teoría clásica. Asimismo, introdu- 
cimos también la variable dinámica p, mediante 


Pp, = Tr Uxpa + YP, + 2p2). (58) 


Su P. B. con r viene dado por 


r[r, py] = [r,rp,-] = [r, xp+ + Yyp, + 2p2] 
= xlr, pa] + ylr, py] + 2 lr, pa) 
= 2: X/r4- Y Yy/r + 2:2/r = r. 
Luego, 
[r, Pr] 0 1 
o bien, 
rp, — p,r = ih. 
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La relación de conmutación entre r y p, es precisamente la que co- 
rresponde a un par de variables canónicas conjugadas, es decir, la ecuación 
(10) de $ 22. Luego, p, hace las veces de momento canónico conjugado 
de la coordenada r. Pero no es exactamente igual a él, pues no es real; 
su complejo conjugado es 


Pr. = (pex + Pyy + pez)? = (xpa + YPy + 2p2 — 3ihi)r” 
= (rp, —3ifñ)r* = Pr — 2ihr”?. (59) 


Por tanto, p, —ifir”! es real y es el verdadero momento canónico conjuga- 
do de —. | 

El momento angular m de la partícula alrededor del origen viene dado 
por (22) y su magnitud k por (39). Puesto que T y pr son escalares, conmu- 
tan con m y por tanto también con k. Podemos expresar el hamiltoniano en 
función de r, p, y k. Si Y significa suma respecto a las permutaciones 


: TYZ 
cíclicas de los subíndices x, Yy, 2, tenemos 


k(k44i) = Y Mí = Y (xPy—YPa)* 


Iyz TYz 


= Y (xpy*Py+YPaYPo—*PyYPa—YP2*Py) 


uy 


= Y pP+yp—ap Pp y Yp,p A+ p App x—2ihxp,) 


aIYz 
= (Py po Hp po) 
—Ádxpo+Ypr+t2p Apr py +p24%R) 
r(p4 pp) —rp, (p,r+-24h) 
= P(p4 pipi) pis. 


según (59). Luego 


[| 


1 k(k + Rh 
H = a ES (60) 


2m pe 


Esta forma de H es tal que k conmuta no sólo con H como debiera ocurrir 
por ser k una constante del movimiento, sino también con todas las varia- 
bles dinámicas que aparecen en H, a saber, r, Pr y V, siendo esta última, 
función de r. Por tanto, el problema se resuelve fácilmente, pues podemos 
considerar un autoestado de k perteneciente al autovalor X” y sustituir k 
por k' en (60) resultando con ello un problema con un solo grado de li- 
bertad 7. 

Introduzcamos la representación de Schródinger con x, y, 2 diagonales. 
Entonces Pz, Py y Pp. son equivalentes a los operadores —iñ0/0x, —4h0/0y 
y —iho/0z respectivamente. Los estados vendrán representados por una 
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función de onda 4(xyzt) que verifique la ecuación de ondas de Schródinger 
(7) de $ 27, que en este caso con H dado por (57) será | 


oy Rh? pl po? 2? 
hh == —| — EV ss. 61 
a | alta ta) pp (ez) 





Podemos pasar de las coordenadas cartesianas x, y, z a las coordenadas 
polares r, 6, $, mediante las ecuaciones 


x = r sen O cos e, ) 
y = r sen 6 sen e, , (62) 
dl z = rcos 06, ) 


y expresar la función de ondas en función de las coordenadas polares en 
la forma ¿(rópt). De las ecuaciones (62) resulta la siguiente ecuación entre 
operadores 

o 0x0 dy 0 0630  x0 y 0 23 0 


or Teror Oroy Oroz  róx. roy” roz 
que comparada con (58) nos dice que p- = — iho/or. Así, pues, la ecua- 
ción de ondas de Schródinger con el hamiltoniano en la forma (60) es la 
siguiente 





E p2 1 2 k(k +%) l 
A el A 


Aquí k es un cierto operador lineal que como conmuta con 7 y 0/or sólo 
puede depender de 0, $, 0/00 y 0/04. A partir de la fórmula 


k(k +7) = m4 m2 4 m2, (64) 


que se deduce de (39), y de la fórmula (62), podemos calcular la expresión 
k(k + ñ) que resulta ser 
2 
k(k + h) 1 0 O 1 0 (65) 


ban ad A A AS 20 
q? no “oa sente 0p? 





Este operador es muy conocido en física matemática. Sus autofunciones son 
los llamados armónicos esféricos, y sus autovalores son n(n + 1) siendo n 
un número entero. Así pues, la teoría de los armónicos esféricos constituye 
- otra prueba de que los autovalores de k son múltiplos enteros de f. 

La función de ondas para un autoestado de k perteneciente al auto- 
valor ná (n es un entero no negativo) será de la forma 


Y = ry(rijSa(op), (66) 
donde S,(0p) verificará la ecuación 


k(k + ?0S.(09) = n(n + DJf2S, (0%), (67) 
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y según (65) será un armónico esférico de orden n. El factor r”! de (66) lo 
hemos puesto por conveniencia. Sustituyendo (66) en (63) resulta la si- 
guiente ecuación para y 


A y R/ a n(n + 1) E 
ide ] are + ——— HH v 
| 2m E or +) pa (99) 


Si el estado es un estado estacionario perteneciente al valor de la energía H”, 
y será de la forma 





qt) = ale 
y (63) se reducirá a 





Mi EL e AL A >, (69) 
a eva pe 

Esta ecuación se puede utilizar para determinar los niveles de energía H” 
del sistema. Para cada solución yo de (69) correspondiente a un determi- 
nado n, existirán 2n + 1 estados independientes, pues existen 2n + 1 valo- 
res distintos que puede tomar una de las componentes del momento an- 
gular, por ejemplo m.. 

La probabilidad de que la partícula esté en un elemento de volumen 
dxdydz es proporcional a y|?dxdydz. Poniendo y en la forma (66) esto 
equivale a r ?[y/?IS,!.dxdydz. La probabilidad de que la partícula esté 
comprendida entre las dos esferas de radios r y r + dr será proporcional 
a |xlédr. Así resulta evidente que al resolver la ecuación (68) o la E100) hemos 
de imponer una condición de contorno a la función y para r = O, y que 
la integral [ly'“dr converja en torno al origen. Si la integral en cuestión 


no fuera convergente, la función de ondas representaría un estado para 
el que habría una probabilidad infinita de que las partículas estuvieran 
en el origen, lo que es inadmisible desde el punto de vista físico. 

Sin embargo, la condición obtenida para r = O mediante la considera- 
ción del significado probabilístico no es suficientemente restrictiva. Al exi- 
gir que la función de onda que se obtiene resolviendo el problema en 
coordenadas polares (63) sea realmente solución de la ecuación de ondas 
en coordenadas cartesianas (61), obtenemos una condición más restrictiva. 
Consideremos el caso V = 0, que constituye el problema de la partícula 
libre. La ecuación (61) aplicada a un estado estacionario de energía H” =0 
es ahora 


Vi — 0, (70) 
donde V? representa el operador laplaciano ¿*%/2x? + 0%/0y* + 0%/02?, y 


la (63) es 
102%. Kkk+%) 
a 2 )4=0 12) 
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para k = 0,4 = r”? es una solución particular de (71). Sin embargo, esta 
función no es solución de (70), pues aunque V? r”* se anula para todo valor 
finito de r, su integral extendida a un volumen que contenga el origen 
vale — 47 (como puede verse transformando dicha integral de volumen en 
una integral de superficie mediante el teorema de Gauss), y, por tanto, 


Vert = — 4 s(0)8(y)s(z). (72) 


/ 

Luego, no toda solución de (71) es solución de (70), y más en general, no 
toda solución de (63) es solución de (61). Para que al sustituir una solución 
de (63), no aparezca una función 3 en el segundo miembro de (61), tal como 
ocurre en el segundo miembro de (72), hemos de imponer la condición de 
que las soluciones de (63) no tiendan a infinito con la misma rapidez que 
171 cuando r >0, La ecuación (63) sólo es equivalente a la (61) cuando se 
le añade esta condición suplementaria. Así obtenemos la condición de con- 
torno try >0 0 y >0 cuando r >0. 

También hemos de imponer condiciones de contorno a la función de 
ondas para r — oo, Si solamente nos interesan los estados “ligados”, es decir, 
los estados en que la partícula no pueda alcanzar el infinito, hemos de limi- 
tarnos a considerar el caso en que la integral /|y(r)?dr sea convergente 
en el infinito. Sin embargo, los estados ligados no son los únicos estados 
que pueden existir desde el punto de vista físico, pues también podemos 
considerar casos en los que la partícula venga desde el infinito, sea disper- 
sada (scattered) por el campo de fuerzas central, y se dirija después nueva- 
mente al infinito. Para tales estados la función de ondas puede ser finita 
para r > oo. Estos estados serán estudiados en el capítulo VIII cuando 
consideremos los problemas de colisión. Pero, en cualquier caso, la función 
de onda no debe tender a infinito para r > «o, pues representaría un estado 
sin ningún significado físico. 
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El análisis anterior se puede aplicar al problema del átomo de hidró- 
geno despreciando la mecánica relativista y el spin del electrón. La energía 
potención V en este caso vale + —e?/r, y la ecuación (69) se convierte en 


Zo: (73) 


PPP O o. (e a es a 


dr? y? ñ2 rf 0 A? 


El estudio completo de esta ecuación fue hecho por Schródinger.* Aquí 
obtendremos sus autovalores H” por un razonamiento elemental. 





pl 9 2 9 / 
d panas 0 2me 11 mH 


t Aquí e representa la carga del electrón con signo contrario, y no debe confun- 
dirse con el número e utilizando como base en las exponenciales. 
+ SCHRODINGER, Ánn. d. Physik, 79 (1926), 361. 
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Es conveniente poner 
zo = f(r)je”"!”, (74) 


e introducir la nueva función f(r), siendo el coeficiente a igual a una de las 
dos raíces cuadradas 


a = += y —%?/2mHB5. (75) 
La ecuación (73) escrita en función de f(r) es 
de 2d  nn>+1) 2me? 1 
A E de 


Busquemos una solución de la ecuación de la forma de una serie de 
potencias 


f(1) = Y Car, (77) 


en la que los valores de s consecutivos difieran en una unidad, aunque no 
exigimos que hayan de ser enteros. Sustituyendo (77) en (76) resulta 


S csís(s — 1)1972 — (25/a)r"* — m(n + 1)192 4- (2me2/A*)r=%5 = 0, 


que al igualar a cero el coeficiente de r*”? da la siguiente relación entre lós 
coeficientes C, consecutivos 


cs[s(s — 1) —n(n + 1)] = Cs-112(s — 1)/a — 2me?/R?]. (78) 


En la sección anterior vimos que únicamente debíamos considerar autofun- 
ciones y que tendieran a cero con r y, por tanto, según (74), f(r) tiene que 
tender a cero con r. Luego, la serie (77) tiene que terminarse por el lado 
de las s pequeñas, y el mínimo valor de s ha de ser mayor que cero. Pero 
los únicos valores mínimos de s posibles son los que anulan el coeficiente 
de c, en (78), es decir, n + 1 y —n, el segundo de los cuales es negativo 
o nulo. En consecuencia, el mínimo valor de s ha de ser n + 1. Puesto que 
n es siempre entero, los valores de s habrán de ser también enteros. En ge- 
neral, la serie (77) no tiene por qué terminarse para valores grandes de s. 
Para grandes valores de s, la relación entre términos consecutivos será, 
según (78), 
Cs 2 


TI — 
Cs-1 Sa 





Por tanto, la serie (77) convergerá siempre, pues la relación entre términos 
consecutivos para valores grandes de s es la misma que la de la serie 


1 (21 
Lara? Co 
que converge hacia e*”/”. 
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Ahora hemos de investigar el comportamiento de la solución xo para 
valores grandes de r. Hemos de distinguir entre valores de H” positivos y 
valores de H' negativos, el número a de (75) será real. Tomemos, por ejem- 
plo, el valor positivo para a. Entonces para r > o la suma de la serie (77) 
tenderá a infinito según la misma ley que la serie (79), o sea, como e**/s, 
Por tanto, según (74), yo tendería a infinito según la ley e”/*, no represen- 
tando ningún estado con sentido físico. Luego, para H” negativo no hay, en 
general, solución de (73). Sin embargo, existe una excepción y es cuando 
la serie (77) se termina para valores grandes de s, en cuyo caso se verifican 
todas las ecuaciones de contorno. La condición para que ocurra eso es que 
se anule el coeficiente de c,-. en (78) para algún valor del subíndice s— 1 
que no sea menor que su valor n + 1, lo que equivale a la condición 


S me? 


a 
para algún valor de s no inferior a n + 1. Con ayuda de (75) esta condición 
se transforma en 





met 


Ea dl 


3 y 


que es una condición para los niveles de energía H”. Puesto que s puede 
ser cualquier número entero positivo, la fórmula (80) da un conjunto 
discreto de posibles niveles de energía negativa en el átomo de hidrógeno. 
Dichos niveles están de acuerdo con la experiencia. Para cada nivel (excepto 
para el más bajo s = 1) existen varios estados independientes correspon- 
dientes a los diversos valores posibles de n, que pueden ser igual a cual. 
quier número entero positivo o nulo menor que s. Esta multiplicidad de 
estados pertenecientes a un mismo valor de la energía hay que añadirla a 
la estudiada en la sección anterior, debida a los diversos valores posibles 
de una componente del momento angular que existe en cualquier campo 
de fuerzas central. La multiplicidad debida a n tiene lugar únicamente con 
una ley de fuerza del inverso del cuadrado de la distancia, e incluso en 
este caso desaparece al tener en cuenta la mecánica relativista, como ve- 
remos en el capítulo XI. La solución yo de (73) para valores H” de (80) tiende 
a cero exponencialmente para r > y, por tanto, representa un estado 
ligado (que corresponde a las órbitas elípticas de la teoría de Bohr). 

Para valores de H' positivos, el número a de (75) será imaginario puro. 
En tal caso, la suma de la serie (77), que para valores grandes de r es análo- 
ga a la serie (79), conservará un valor finito cuando r =>“ y, en conse- 
cuencia, será una solución posible de (73), a la que corresponderá una 
función de onda y que tiende a cero para r > «o según la ley r”?, Así pues, 
además de los niveles discretos de energía negativa (80) son posibles 
todos los niveles de energía positiva. Los estados de energía positiva no 
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son estados ligados, pues para ellos la integral S|yo[?dr no converge en el 
infinito. (Estos estados corresponden a las órbitas hiperbólicas de la teoría 
de Bohr.) 


40. Reglas de selección 


Un sistema dinámico abandonado en un estado estacionario, permane- 
cerá en dicho estado mientras no actúen sobre él fuerzas exteriores. Sin 
embargo, en la práctica, sobre un sistema atómico cualquiera actúan fre- 
cuentemente campos electromagnéticos externos, bajo cuya acción puede 
pasar el sistema de un estado estacionario a otro. La teoría de estas transi- 
ciones será desarrollada en los $$ 45 y 46. Una consecuencia de esta teoría 
es que, con gran aproximación, no pueden ocurrir transiciones entre dos 
estados por influencia de una radiación electromagnética, si en una repre- 
sentación de Heisenberg en la que dicho par de estados son dos estados 
básicos, el elemento de matriz del desplazamiento eléctrico total D del sis- 
tema relativo a dicho par de estados es nulo. Pero ocurre que para muchos 
sistemas atómicos la mayoría de los elementos de matriz de D en una repre- 
sentación de Heisenberg son nulos y, por tanto, existen severas limitaciones 
de las posibilidades de transición. Las reglas que expresan dichas limita- 
ciones se denominan reglas de selección. 

La idea de las reglas de selección se puede profundizar mediante la 
aplicación más detallada de la teoría de $$ 44 y 45, y según ella los elemen- 
tos de matriz de las distintas componentes cartesianas del vector D están 
asociadas con los distintos estados de polarización de la radiación electro- 
magnética. La naturaleza de dicha asociación es tal que si considerásemos 
los elementos de matriz o, mejor dicho, sus partes reales como amplitudes 
de osciladores armónicos que interaccionan con el campo de radiación de 
acuerdo con las leyes de la electrodinámica clásica, obtendriíamos el mismo 
resultado. 

Hay un procedimiento general para obtener todas las reglas de selec- 
ción, que es el siguiente. Llamemos «a a las constantes del movimiento diago- 
nales en la representación de Heisenberg, y sea D una de las componentes 
cartesianas de D. Hemos de obtener una ecuación algebraica que rela- 
cione D y las constantes « en la que no intervenga ninguna otra variable 
dinámica más que la D y las a y que sea lineal respecto a D. Tal ecua- 
ción será de la forma 


2 fr Dg, = 0, (1) 


en la que las f, y las g, son funciones únicamente de las a. Si expresamos 
esta ecuación en función de los representantes resulta 


Ha Dl” > ga”) = 0, 
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o bien 


<eDja”> 2 f8)gr(a”) = 0, 
que nos dice que <a'Dla””> = O a no ser que 


2 $e2)gd0") = 0. (82) 


Esta última ecuación que da mm relación que tiene que existir entre o y a” 
para que <a /Dja””> no sea nulo, constituye la regla de selección corres- 
pondiente a la componente D de D. 

El estudio del oscilador armónico hecho en $ 34 nos proporciona un 
ejemplo de regla de selección. La ecuación (8) es de la forma (81) con 7 en 
lugar de D, y donde H juega el papel de las a; de ella se deduce que 
todos los elementos de matriz <H'17|H"”> de 7 son nulos excepto aquellos 
para los que H”— H' = ho. El resultado complejo conjugado de éste 
es que los elementos de matriz <H(n¡H”> de y son todos nulos excepto 
aquellos para los que se verifica H”—-H'— —Rou. Como q es igual a 
7%) —7 multiplicado por un factor numérico, sus elementos de matriz 
<H"lq!H”> serán todos nulos a excepción de los correspondientes a H” — 
— H = ño. Si el oscilador armónico tiene carga eléctrica, su despla- 
zamiento eléctrico D será proporcional a q. Así resulta que la regla de 
selección permite únicamente transiciones en las que la energía H cambie 
en un solo cuanto ho. 

Ahora vamos a obtener las reglas de selección de m, y k para un electrón 
que se mueva en un campo de fuerzas central. Las componentes del des- 
plazamiento eléctrico ahora son proporcionales a las coordenadas cartesia- 
nas x, Y, 2. Tomemos primero m, que, como sabemos, conmuta con z 


M¿Z — Z2M¿ = O, 
Esta ecuación es del tipo exigido (81), y nos da la regla de selección 
m—m!=0 


para la componente z del desplazamiento. Además, a partir de las ecua- 
ciones (23) resulta 
[m,, [m,, x]] > [m,, y] = —X 
o bien, 
mix — 2m,xm, + xm?—h?x = 0, 


que también es del tipo (81), y que nos da la regla de selección 
m?—2m m4 m*—h 0 
o bien, 
(m, —m¿—h)im, —m/+%f) = 0 


para la componente x del desplazamiento. La regla de selección para la 
componente y será la misma. Por tanto, las reglas de selección para m, son 
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las siguientes: en las transiciones asociadas a una radiación cuya polari- 
zación corresponde a un dipolo eléctrico orientado según el eje 2, 
m, no puede cambiar, mientras que en las transiciones asociadas a una 
polarización correspondiente a un dipolo eléctrico orientado según la di- 
rección del eje x o según la dirección del eje y. mí tiene que cambiar 
en =4%. 

Podemos determinar con más precisión el estado de polarización de la 
radiación asociada a una transición en la que m”, cambie en = %, teniendo 


en cuenta la condición para que los elementos de matriz de x + iy y de 
x —iy no sean nulos. Tenemos 


[m, x + iy] = y —ix = —i(x + 1y) 
O sea, 


max + iy) — (2 + iy)tm.+%) = 0, 
que también es una ecuación del tipo (81). De ella deducimos la condición 
m—w—h=0 


que debe verificarse para que <m'|x + iylm”> no sea nulo. Análogamente 


obtenemos 
124 
mM —m¡+h=0 


como condición para que <m'ix —iyjm'”> no sea nulo. Luego 
<mx — iym, —h> = 0 
o sea 
<mlxim, —h> = ¡<mílyim.—h> = (a + ibje'"* 
en donde a, b y « son reales. La ecuación compleja conjugada de ésta es 
<m, —hlxim!> = —i<m!, —hiyim/> = (a—ib>e "* 
Por tanto, el vector ¿(<m/|[Dim — Rh» + <m”, —h|Dim”>), que determina 


el estado de polarización de la radiación asociada a las transiciones en las 
que m% = m,—+%h, tiene las tres componentes siguientes 


3(<m¿xjm, —h> + <m, —hxim,)) 
= Yí(a + ibje'”* + (a —ibje"**) = a cos aut — bsen ot, 
H<m,lylm, —h> + <m, —ñlylm'>5 | (83) 
= tií— (a + ibjer"* + (a — ibje"*"*) = a sen ot+ b cos at, 
H<mladm, —h)> + <w,—hlaim!>) = 0. 
Por la forma de estas componentes vemos que la radiación asociada que 


se propaga en la dirección del eje 2 estará polarizada circularmente, la 
que se propaga en una dirección cualquiera del plano xy lo estará rectilí- 
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neamente en dicho plano, y las que se propagan en direcciones intermedias 
lo estarán elípticamente. El sentido de la polarización circular de la radia- 
ción que se mueve en la dirección del eje z dependerá de si w es positivo O 
neo que dependerá, a su vez, de cuál de los dos estados m' o m” = 
= m' —hÁ tenga mayor energía. 

Vamos a determinar ahora la regla de selección para k. Tenemos 


[K(k +%).2] = [m3 2] + [m, 2] 
— — YM, — MY + XxM, + MX 
— 2(m,x—m,y + ihz) 
— 2m,x — yMs) = 2xm, — my). 
Análogamente 
[k(k + h),x] = 2ym, — m,z) 
z 
[k(k + %), y] = 2m,2 — xm,). 
Luego, 


[K(k + 7), [k(k + %), 21] 
— 2[k(k + hi), m,x — m,y + ihz] 
— 2m,[k(k + 70), 1]—2m,[k(k + %), y] + 2ih[K(k + %), 2] 
— 4m,y(ym, — m,z) — 4mam,z — cae) + 2(k(k + ñR)z— zk(k + h); 
=— 4Am,x+m m zm, — 4(m? + m* 
(m,x 4 m,y + m2) (mé + O a — KK + 0) 
De (22) deducimos 
Mx + My + mM2x = 0 (84) 
luego 
[K(k +75), [k(k + %),2]] = —2K(k + 82 + 2k(k + %)) 
que da 
K2(k + h)?z — 2k(k + h)zk(k + hi) + zk"(k + hy — 
— 2RAKk(k+ h)z + zk(k + Rh) = 0. (85) 


Para x e y resultan ecuaciones similares. Dichas ecuaciones son del tipo 
exigido (81) y de ellas deducimos la regla de selección 


KA +A) — 2(% + 7)K" (E +7) + (+ hi— 
— 2%k (K' + hh) —2Pk” (k" + %A) = 0, 
que se reduce a 


(SER Y ANNE RN — Ke + AN Ki" — hi) =0. 


Unicamente puede tener lugar una transición entre dos estados Kk' y k” si 
se anula alguno de estos cuatro factores. 

Ahora bien, el primero de dichos factores (k' + k” + 2f) no se puede 
anular nunca ya que los autovalores de k son todos positivos o nulos. El se- 
gundo (k' + k”) sólo se puede anular si *” = 0 y k” = 0. Pero no pueden 
ocurrir transiciones entre estados con dicho valor de k debido a otras reglas 
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de selección, como podemos ver con el siguiente argumento. Si dos estados 
que (designamos respectivamente con una y dos primas) son tales que 
k' = 0 y k” = 0, entonces según (41) y los resultados correspondientes 
para m, y m debe ser wW =mw =m"%wW =0ym = m' = m” =0. 
La regla de selección para m, nos dice que cuando el valor de m, no cam- 
bia en la transición, los elementos de matriz de x y de y correspondientes 
a los dos estados son nulos y de la regla de selección correspondiente para 
m, y mM, deduciríamos que el elemento de matriz de z también es nulo. 
Por tanto, no pueden ocurrir transiciones entre tales estados. Así la regla 
de selección para k se reduce a 


(Ek + Ak —Kk"—h) =0, 


que muestra que k tiene que cambiar en +h. Dicha regla de selección se 
puede escribir en la forma 


k?—2K'k” + k2=—%h* = 0, 


y como ésta es la condición para que el elemento de matriz <K'[z|k”> no sea 
nulo, resulta la ecuación 


k2z — 2kzk + zk? —h?z — O, 
o sea 


[k, [k, 2]] = —-2, (86) 


resultado que no es posible obtener fácilmente por un procedimiento más 
directo. 

Como ejemplo final vamos a obtener la regla de selección para la mag- 
nitud K del momento angular total M de un sistema atómico general. 
Sean x, y, z las coordenadas de uno de los electrones. Hemos de obtener la 
condición para que los elementos de matriz (K”, K”) de x, y, z no sean nulos. 
Es evidente que dicha condición equivale a la condición de que los ele- 
mentos de matriz (K”, K”) de A,, A2 y Ag no sean nulos, donde As, Az y Az 
son tres funciones lineales de x, y, z independientes con coeficientes numéri- 
cos o, más en general, con coeficientes cualesquiera con tal de que conmu- 
ten con K y que, por tanto, estén representados por matrices diagonales 
respecto a K. Sea 

Av = M,x + Myy =- Maz, 
Ae = M,z— My — ihx, 
== MA Mz — ihy, 
A: = May — Myx — ihz, 
Según (29), tenemos 
Mis + MyAy + Mods = Y» (M.M,2— M.My —ihMx) 
zyz 


=Y (MM, — M,M.— ihMyz =0 (87) 


vYyz 
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Por lo tanto, Az, Ay y A. no son funciones de x, y, 2 linealmente indepen- 
dientes. Sin embargo, dos de ellas cualesquiera junto con Ao sí son tres 
funciones de x, y, z linealmente independientes y que, por tanto, se pueden 
tomar como las anteriores A1, A2 y As, pues los coeficientes My, M, y M. 
conmutan todos ellos con K. Nuestro problema se reduce, por consiguiente, 
a hallar la condición para que los elementos de matriz (K”, K”) de Ao, As, 
Ay y A¿ no sean nulos. El significado físico de las A es el siguiente: Ao es 
proporcional a la componente del vector (x, y, z) en la dirección del vec- 
tor M, y Az, Ay y A. son proporcionales a las componentes cartesianas de 
la componente de (x, y, 2) perpendicular a M. 

Como Ay es un escalar tiene que conmutar con K. Resulta, pues, que 
únicamente pueden ser distintos de cero los elementos de Ao diagonales, 
es decir, <K'|Ao|K'>, luego, la regla de selección concerniente a Ao es que K 
no puede cambiar en la transición. Aplicando (30) al vector Az, Ay, Az, 
tenemos 


[M., Ag] 5 Ay, [M-, Ay) + — hs, [M., Az] = 0. 


Estas relaciones entre M, y As, Ay, A¿ son exactamente de la misma forma 
que las relaciones (23) y (24) entre m, y x, y, z, y asimismo (87) es también 
de la misma forma que (84). Por tanto, las variables dinámicas Az, Ay y Az, 
tienen las mismas propiedades respecto al momento angular M que tenían 
las x, y, z respecto a m. En consecuencia, la deducción de la regla de 
selección para k cuando el desplazamiento eléctrico es proporcional a 
(x, y, 2) puede repetirse para hallar la regla de selección para K cuando 
el desplazamiento es proporcional a (Az, Ay, Az). De este modo encontramos 
que en lo que concierne a Az, Ay y Az, la regla de selección para K es que 
en la transición ha de cambiar en =%. 

Reuniendo los resultados, obtenemos la regla de selección para K según 
la cual tiene que cambiar en O o en +A. Hemos considerado únicamente el 
desplazamiento eléctrico producido por un solo electrón, pero esta misma 
regla de selección ha de ser válida para cada electrón y en consecuencia 
ha de valer también para el desplazamiento eléctrico total, 


41. El efecto Zeeman en el átomo de hidrógeno 


Ahora vamos a considerar el sistema constituido por un átomo de hidró- 
geno sometido a la acción de un campo magnético uniforme. El hamilto- 
niano (57) con V = —e?/r que caracteriza al átomo de hidrógeno en 
ausencia de campo externo, vendrá modificado por el campo magnético. 
En mecánica clásica, la modificación consiste en sustituir las componentes 
del momento Pz, Py Y Pe por pz +€/c: Az, py +e/c:A,, p.+.e/c: Az, en 
donde A, A, y A. son las componentes del vector potencial que caracteriza 


12. -—— CUÁNTICA 


* 
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al campo. En un campo uniforme de magnitud JY según la dirección del 
eje z, podemos tomar A, = —3H,, A, = 34Hx, A¿ = 0. El hamiltoniano 
clásico sería entonces 


1 l e 2 l e 2 o | e? 
H = ar (r—37%) +(p.+324x) ds eS 


Este hamiltoniano puede tomarse también en la teoría cuántica añadiéndole 
el término que da el efecto del spin del electrón. Según la evidencia expe- 
rimental y según la teoría del capítulo XI, el electrón tiene un mo- 
mento magnético igual a —ehñ/2mc: a, donde a es el vector de spin de 
$ 37. La energía de este momento magnético en el campo magnético será 
ehHH/2mc 0, Luego, el hamiltoniano cuántico total será 


| 1 l e 2 l e Ñ e? 
H = 2 lr) +(m+ 32042) + + 





pan 07 (88) 
2mc 


En rigor deberíamos añadir otros términos en este hamiltoniano que die- 
sen la interacción del momento magnético del electrón con el campo eléc- 
trico del núcleo atómico; pero dicho efecto es pequeño, del mismo orden 
de magnitud que la corrección que resulta al tener en cuenta la mecánica 
relativista, y por ahora no lo consideraremos. Ya lo tendremos en cuenta 
más adelante cuando estudiemos la teoría relativista del electrón en el 
capítulo XI. 

Si el campo magnético no es muy grande, podemos despreciar los tér- 
minos en 4*?, y con ello el hamiltoniano (88) se reduce a 


q Me bei dicas 2) e  eH | ehH 
= ——(p” A A A O 
2m Pp, + P,+ P r ma Py TB, ia 2mc “2 
1 e e 
AE 2 2 ey A =S 
= 4 PA) gn, + ho) (89) 


Los términos extras debidos al campo magnético son ahora e*/2mc : (m, + 
his,). Pero dichos términos conmutan con el hamiltoniano total y, en con- 
secuencia, son constantes del movimiento. Esto hace que el problema sea 
muy sencillo. Los estados estacionarios del sistema, es decir, los autoestados 
del hamiltoniano (89) serán los mismos que cuando no había campo mag- 
nético alguno, o sea los autoestados comunes a los observables m, y a, O 
cuando menos al observable m, + ho,, y los niveles de energía del sistema 
serán los mismos que en ausencia del campo, dados por (80) si conside- 
ramos únicamente estados ligados a los que habrá que añadir un autovalor 
de eH/2mc :(m, + hoz). Luego, los estados estacionarios del sistema en 
ausencia de campo para los que m, tenía el valor numérico m/ múltiplo 
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entero de hi, y 9, o a su vez el valor numérico ==l, seguirán siendo 


estacionarios cuando apliquemos el campo. Su energía vendrá aumentada 
en una cantidad que es la suma de dos partes; una parte eXY/2mc - mn” 


que proviene del momento angular orbital y que se puede conside- 
rar debida a un momento magnético orbital —em' /2mc, y otra parte 


eH/2mc ha” que es debida al spin. La relación entre el momento mag- 
nético orbital y el momento angular orbital n” vale — e/2mc, que es la 


mitad de lo que vale la relación entre el momento magnético de spin y el 
momento angular de spin. A veces se hace referencia a este hecho como 
anomalía del spin. 

Como los niveles de energía dependen ahora de m,, la regla de selec- 
ción obtenida en la sección anterior para m, se puede confrontar directa- 
mente con la experiencia. Tomemos una representación de Heisenberg en 
la que entre otras constantes del movimiento, m, y s. sean diagonales. La 
regla de selección para m, exige en este caso que m, cambie en %h, 0, o 
—+AÁ, mientras que «, por conmutar con el desplazamiento eléctrico no 
deberá cambiar. Luego, la variación de energía en la transición entre los 
dos estados diferirá del valor en ausencia de campo electromagnético en 
una cantidad igual a ehW/2mc, 0, o —ehH/2Zmc. Por tanto, según la condi- 
ción de Bohr para las frecuencias, la frecuencia de la radiación electro- 
magnética asociada diferirá de la correspondiente a la ausencia de campo 
magnético en e4H/4rwmc, 0, o —eH/4rwmc. Esto significa que cada una de 
las líneas espectrales que aparecía en ausencia de campo magnético. se 
desdoblará en tres componentes. Si consideramos la radiación que se emite 
en la dirección del eje z, según (83), las dos componentes extremas estarán 
polarizadas circularmente, mientras que la línea central no desplazada será 
de intensidad nula. Estos resultados están de acuerdo con la experiencia 
y también con la teoría clásica del efecto Zeeman. 


VII 


TEORÍA DE PERTURBACIONES 


42. Generalidades 


En la sección anterior hemos estudiado rigurosamente algunos siste- 
mas sencillos de la teoría cuántica. Sin embargo, la mayoría de los pro- 
blemas que se plantean en esta teoría no se pueden resolver exactamente 
con los recursos matemáticos actuales, pues conducen a ecuaciones cuyas 
soluciones no se pueden expresar mediante un número finito de términos 
con las funciones ordinarias del análisis. Para dichos problemas puede 
utilizarse, con frecuencia, un método de perturbaciones. Dicho método con- 
siste en separar el hamiltoniano en dos partes, de las cuales una ha de ser 
sencilla y la otra pequeña. La primera de ellas puede ser considerada como 
el hamiltoniano de un sistema simplificado o no perturbado que se puede 
estudiar con todo rigor, mientras que la adición de la segunda no intro- 
ducirá más que pequeñas correcciones de la naturaleza de una perturbación 
en la solución del sistema no perturbado. La exigencia de que la primera 
parte sea sencilla implica en la práctica que no sea función explícita del 
tiempo. Si la segunda parte contiene un pequeño factor numérico e, pode- 
mos obtener la solución de las ecuaciones del sistema perturbado en la 
forma de una serie de potencias de e, que si converge nos dará la solución 
del problema con tanta aproximación como queramos. Incluso cuando dicha 
serie no converge, ocurre muchas veces que la primera aproximación obte- 
nida con ella es bastante precisa. 

En la teoría de perturbaciones hay dos métodos. En uno se considera 
que la perturbación provoca una modificación de los estados de movimiento 
del sistema no perturbado. En el otro en vez de considerar una modificación 
de los estados del sistema no perturbado, se supone que el sistema pertur- 
bado en lugar de permanecer siempre en uno de dichos estados, cambia 
constantemente de uno a otro, o sea, se considera que bajo la influencia 
de la perturbación se producen transiciones. El método que debe emplearse 
en cada caso particular depende de la naturaleza del problema que ha de 
resolverse. El primer método, por lo general, sólo tiene utilidad cuando la 
energía de la perturbación (es decir, la corrección que debe añadirse al 
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hamiltoniano del sistema no perturbado), no es función explícita del tiempo, 
en Cuyo caso se aplica a los estados estacionarios. También se puede utili- 
zar para calcular resultados que no se refieren a un instante de tiempo 
particular, tales como niveles de energía o estados estacionarios del sistema 
perturbado, y en los problemas de colisión, para calcular la probabilidad 
de que las partículas sean dispersadas bajo un cierto ángulo. En cambio, 
en todos los problemas en que entra en consideración el tiempo, como los 
que hacen referencia a los fenómenos transitorios que se producen cuando 
se aplica repentinamente una perturbación, o en general todos aquellos 
problemas en los que la perturbación varía de alguna manera con el tiem- 
po (es decir, cuando la energía de la perturbación es función explicita del 
tiempo), tenemos que emplear el segundo método. Asimismo hemos de 
emplear el segundo método en los problemas de colisión para calcular 
las probabilidades de absorción y de emisión aunque la energía de per- 
turbación no sea función explícita del tiempo, pues contrariamente a lo 
que ocurre con las probabilidades de dispersión, estas probabilidades no 
se pueden definir sin hacer referencia a un estado de cosas que varía con 
el tiempo. 

Podemos resumir los rasgos. característicos de ambos métodos de la 
siguiente forma: en el primer método comparamos los estados estacionarios 
del sistema perturbado con los del sistema no perturbado, y en el segundo 
método se considera un estado estacionario del sistema no perturbado 
y se estudia cómo varía bajo la influencia de la perturbación. 


43. Variación de los niveles de energía producida por una perturbación 


Vamos a aplicar el primero de los dos métodos mencionados para 
calcular las variaciones de los niveles de energía de un sistema producidas 
por una perturbación. Supondremos que la energía de perturbación, al 
igual que el hamiltoniano del sistema no perturbado, no es función expli- 
cita del tiempo. Desde luego, nuestro problema sólo tiene sentido si los 
niveles de energía son discretos, y si las diferencias entre ellos son gran- 
des en comparación con los cambios que la perturbación introduce en ellos. 
Este hecho hace que el planteamiento de los problemas de perturbación 
por el primer método sea distinto cuando los niveles de energía del sistema 
no perturbado son discretos y cuando son continuos. 

Sea | 
H=E>+V, (1) 


el hamiltoniano del sistema perturbado, en donde E representa el hamil- 
toniano del sistema no perturbado y V la pequeña energía de perturba- 
ción. Por hipótesis, cada autovalor H” de H está muy próximo a uno y sólo 
un autovalor E” de E. Utilizaremos el mismo número de primas para de- 
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signar un autovalor de H y el autovalor de E que está muy próximo a él. 
Por tanto, H” diferirá de E” en una pequeña cantidad de orden V y, en 
cambio, diferirá de E” en una cantidad que no es pequeña salvo si El! =— E”. 
Deberemos utilizar siempre cuidadosamente distinto número de primas para 
designar autovalores de H y de E que no nos interese hacer constar que 
están muy próximos. 

Para obtener los autovalores de H hemos de resolver la ecuación 


H|H'> = H'H”> 
GQ bien 
| (H'—E)H'> = V|H'>. (2) 
Sea |0> un autoket de E perteneciente al autovalor E” y supongamos que 
los |H"> y H' que verifican (2) difieren de |0> y E' en pequeñas cantidades 
que podemos expresar así 


[H> = [0 + ID +12 +..., 
(3) 


j 


7 E +41 +4025+..., 


siendo [1> y a; infinitésimos de primer orden (es decir, del mismo orden 
que V), [2> y az de segundo orden, etc. Sustituyendo estas expresiones en (2) 
resulta 


(E —E +41 +42 +...H0> + [D+12+..3 = Vi0> +11) ...). 


Si ahora separamos los términos de orden cero, los de primer orden, los de 
segundo y así sucesivamente, resultan las siguientes ecuaciones 


(Er —E)J0> = 0, 
(El —EJ1> + a,10> = VIO», 


(Er — E)2> + ar]1> + ae /0> = VID, (4) 


La primera de estas ecuaciones no nos dice más que lo que habíamos su- 
puesto previamente, o sea que [0> es un autoket de E perteneciente al 
autovalor E”. Las otras nos permiten calcular las distintas correcciones >, 
(25, ...) Y Uy, lo, .. 

Para seguir discutiendo estas ecuaciones es conveniente introducir una 
representación en la que E sea diagonal, es decir, una representación de 
Heisenberg para el sistema no perturbado con E como uno de los obser- 
vables con cuyos autovalores se designan los representantes. Represente- 
mos por 8 los demás observables en el caso de que sean necesarios, como 
ocurre cuando existe más de un autoestado de E perteneciente a un mismo 
autovalor. Así los bras básicos serán <E”B8”]. Como |0> es un autoket de E 
perteneciente al autovalor E”, tenemos 


<E”B"10> La 2. 18, 5 
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siendo f(8”) una cierta función de las variables 8”. Con ayuda de este resul. 
tado, la segunda de las ecuaciones (4) escrita en forma de representantes 
será 


(E — E" E"BUD +08 pp f(8") = 2 EP 1ViE'8">f(8". (6) 
Haciendo E” =— E”, queda 
afle”) = Y <EBUVIE' BOB). (7) 


8! 

En lo que concierne a las variables 8”, la ecuación (7) es del tipo clásico 
en la teoría de autovalores. En ella vemos que los diversos valores posibles 
de a, son los autovalores de la matriz <E'8B”|V|E'8>. Esta matriz es una 
parte del representante de la energía de perturbación en la representación 
de Heisenberg del sistema no perturbado, a saber, la parte de matriz 
que corresponde a los elementos que hacen referencia al nivel de energía 
E' tanto respecto a filas como respecto a columnas. Cada uno de estos 
valores de a, da un nivel de energía del sistema perturbado próximo al 
nivel de energía E' del sistema no perturbado* en la aproximación de 
primer orden. Por tanto, pueden existir distintos niveles de energía del 
sistema no perturbado independientes que pertenezcan al nivel de ener- 
gía E'. La perturbación puede producir un desdoblamiento total o parcial 
de los niveles de energía que para el sistema no perturbado tienen todos 
el mismo valor E”. 

La ecuación (7) determina asimismo los representantes <E”8”]0> de los 
estados estacionarios del sistema perturbado pertenecientes a los niveles 
de energía próximos a E', en la aproximación de orden cero, ya que cada 
solución f(8”) de (7) sustituida en (5) constituye uno de dichos represen- 
tantes. Cada uno de dichos estados estacionarios del sistema perturbado 
está próximo a un estado estacionario del sistema no perturbado, pero el 
recíproco que consistiría en que cada estado estacionario del sistema no 
perturbado estuviera próximo a un estado estacionario del sistema pertur- 
bado no es cierto, va que el estado estacionario general del sistema no 
perturbado perteneciente al nivel de energía E” está representado por el 
segundo miembro de (5) en donde f(8”) es una función arbitraria. El pro- 
blema de hallar los estados estacionarios del sistema no perturbado que 
aproximan a estados estacionarios del sistema perturbado, o sea, el proble- 
ma de hallar las funciones f(8”) de la ecuación (7) corresponde al cálculo 
de las “perturbaciones seculares” de la mecánica clásica. Observemos que 


t Para distinguir los niveles de energía que así resultan necesitaríamos una nota- 
ción más elaborada, ya que de acuerdo con nuestra actual notación todos ellos tendrían 
que tener un número de primas igual al que sirve. para designar el nivel de energía 
del sistema no perturbado del que derivan. Sin embargo, para nuestros propósitos no 
será necesaria tal notación. 


-- ¿nes als 
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los resultados anteriores no dependen de los valores de los elementos 
de matriz de la energía de perturbación que hacen referencia a dos nive- 
les de energía distintos del sistema no perturbado. 

Veamos cómo se simplifican los resultados establecidos aquí en el caso 
particularmente sencillo de que no exista más que un único estado esta- 
cionario del sistema no perturbado perteneciente a cada nivel de energía.! 
En este caso E determina la representación por sí sólo, y no se precisa 
ningún 8. La suma de (7) se reduce ahora a un único término, y así 
resulta 

ay = CENVIE?). (8) 


No existe más que un único nivel de energía del sistema perturbado 
próximo a cada nivel de energía del sistema no perturbado, y la variación 
de energía en la aproximación de primer orden es igual al correspondiente 
elemento diagonal de la energía de perturbación en la representación de 
Heisenberg del sistema no perturbado, o sea, al valor medio de la energía 
de perturbación en el correspondiente estado no perturbado. La última 
formulación del resultado es la misma que en mecánica clásica cuando el 
sistema no perturbado es múltiplemente periódico. 

Vamos a calcular la corrección de segundo orden a, de los niveles de 
energía en el caso de que el sistema no perturbado no sea degenerado. 
La ecuación (5) se convierte en este caso en 

<E"0> = 3 


E"E' 
prescindiendo de un factor numérico sin importancia, y la ecuación (6) es 


ahora 


(E' EA E"KE“ID + a; 8 sd <E"¡V|E”> . 


LE! 


De ella podemos despejar el valor de <E”|1> cuando E” < E”, 


<E"|V|E'> 
E'll> — pi. 9 
< | ? E" — E” ( ) 


La tercera de las ecuaciones (4) escrita en forma de representantes es 


(E/ E E"KE”/|2> + a,<END + do S — y <E"WE"> CEI, 


E PI 


E Er 
Y haciendo E” — E' queda 
a<E 0D +42 = Y <ENVIE"><E"1>, 


E 1) 





Y Los sistemas con un único estado estacionario para cada nivel de cnergía 
se denominan a menudo sistemas no degenerados, y los que poseen dos o más estados 
estacionarios pertenecientes al mismo nivel de ra sistemas degenerados; sin em- 
bargo, esta nomenclatura no es muy apropiada desde el punto de vista moderno. 
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que con ayuda de (8) se reduce a 


d4= Y <ENVIEN<E“L. 


Ñ EE! 
Sustituyendo el valor <E”|1> dado por (9) resulta finalmente 


<E'V|E”> <E"|VIE'> 
de — _—_ o 7 __— A ÓÁ 
Ea E! _ E” 
que da como corrección total para la energía en segunda aproximación el 
valor 


<E'¡V|E”> <E"[V|E”> 


O (10) 


a, + as =<EVIE>+ D, 

EPA E 

Este método se puede desarrollar para calcular aproximaciones de 

órdenes superiores si fuera necesario. Born, Heisenberg y Jordan* han 

establecido fórmulas de recurrencia generales que dan la corrección co- 

rrespondiente a la aproximación de orden n en función de las correcciones 
de orden inferior. 


44, La perturbación considerada como causa de transiciones 


Vamos a considerar ahora el segundo método de calcular perturbacio- 
nes que mencionábamos en $ 42. Supongamos como antes que tenemos 
un sistema no perturbado caracterizado por un hamiltoniano E que no es 
función explícita del tiempo, y una energía de perturbación V que ahora 
puede ser una función cualquiera del tiempo. El hamiltoniano del sistema 
perturbado será como antes H = E + V. Para este método no significa 
ninguna diferencia esencial el hecho de que los niveles de energía del sis- 
tema no perturbado, es decir, los autovalores de E, constituyan un conjunto 
discreto o continuo. Pero para concretar tomaremos el caso en que los nive- 
les de energía son discretos. También ahora trabajaremos en una repre- 
sentación de Heisenberg del sistema no perturbado, pero como ahora no 
representa ninguna ventaja elegir E como uno de los observables cuyos 
autovalores sirven para designar los representantes, tomaremos un conjunto 
de a general. 

Supongamos que en el'instante inicial t, el sistema está en un estado 
en el que las « tienen ciertamente los valores a. El ket correspondiente a 
dicho estado es el ket básico |a”>. Si no hubiese ninguna perturbación, es 
decir, si el hamiltoniano fuese E, dicho estado sería estacionario. La pertur- 
bación hace que el estado cambie. En el instante t el ket que corresponde 


t Z. $. Physik, 35 (1925), 565. 
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al estado en la imagen de Schródinger será Tia'>, según la ecuación (1) 
de $ 27. La probabilidad de que los « tengan los valores a” será 


Pla”) = |<Tjo> [?. (11) 


Para a" % a, Pax”) es la probabilidad de que haya una transición desde 
el estado a' al estado a” durante el intervalo de tiempo de ty a t, mientras 
que P(a'a”) es la probabilidad de que no haya ninguna transición. La suma 
de P(a'a””) para todo a”, como siempre, es igual a uno. 

Ahora supongamos que el sistema en lugar de estar inicialmente en el 
estado a” con certeza, esté en uno y otro de los distintos estados «' 
con la probabilidad P_. La densidad de Gibbs que corresponde a dicha 
distribución, según (68) de $ 33 es 


pz OB <a (12) 


En el instante f, cada ket ja'> habrá pasado a Tla> y cada bra <g'| a 
<a ¡T, con lo que p se habrá transformado en 


pp = Y Tia >P <a" T. (13) 


Según (73) de $ 33, la probabilidad de que los « tengan los valores a” será 
entonces 


<a” lpsla””> — s <a" |Tla'>P, <a Tla”> 
= DABA) (14) 


tras aplicar (11). Este resultado indica que la probabilidad de que el sis- 
tema esté en el estado a/” en el instante t es igual a la suma de las proba- 
bilidades de que en el instante inicial estuviera en un estado cualquiera 
a Ha” y haya hecho una transición desde dicho estado a” al estado a”, 
más la probabilidad de que el sistema estuviera inicialmente en el estado a” 
y no haya hecho ninguna transición. Por tanto, las diversas probabilidades 
de transición son independientes unas de otras, de acuerdo con las leyes 
ordinarias de las probabilidades. 

Así pues, el problema de calcular las transiciones se reduce a la deter- 
minación de las amplitudes de probabilidad <a”|Tla'>. Éstas se pueden 
estudiar a partir de la ecuación diferencial en T, (6) de $ 27 


ih dT/dt = HT = (E + V)T. (15) 
Para simplificar el cálculo introducimos el operador 


T* —= gEMtY/RT. (16) 
Tenemos 
ihdT*/dt = etE(t)/4(— ET + ih dT/dt) 


a eE ty/RAVT — V*T*, (17) 
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en donde 
V* — ei (1/4 Y gtElEp/A (18) 


es decir, V* es el resultado de aplicar una cierta transformación unitaria 
a V. La ecuación (17) es más apta para el cálculo que (15), pues en (17) 
la variación de T* depende enteramente de la perturbación V, y para 
V = 0, T* conserva el valor inicial de T* que es igual a la unidad. Según 
(16) tenemos 

<A TA) = CECAMALOT >, 
o sea, 

Pla”) = |<a"[T*la> [P, (19) 
por lo que T* y T son igualmente útiles para determinar las probabilidades 
de transición. 

Hasta aquí todo el estudio realizado es exacto. Ahora vamos a suponer 
que V es un infinitésimo de primer orden y expresaremos T* en la forma 


T* — E e a (20) 
donde T* será de primer orden, 17 de segundo, etc. Sustituyendo (20) en 
(17) e igualando Jos términos del mismo orden resulta 


ih dT*/dt = 1, l 
ih dT*/dt = VES: (21) 


De la primera de estas ecuaciones obtenemos 
t 
T+ =—ih" | v*() de. (29) 
t, 
y de la segunda resulta 
t t! 
T¿ = —h2 | vw) ae | vee) ae: (23) 
t to 


y así sucesivamente. Para muchos problemas prácticos es suficiente con- 
servar el término T*, que nos da un valor de la probabilidad de transición 


Plata”) con aa 
2 


Plata”) = hi2 | <q" | V*(4) dt'ja”> 
t, 








(24) 


so 
pan 


É a 
=+t2| | <evs(0)> de 
t, 








Asi obtenemos la probabilidad de transición en segundo orden de aproxi- 
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mación. El resultado sólo depende del elemento de matriz <a”[V*(1)ja”> 
de V*(t) relativo a los dos estados en cuestión, en el tiempo t' que media 
entre to y t. Como V* es real igual que V, tenemos 


<ariVt(U)]la> = <a IV *(é)la”> 


Pla”) = Plaga) (25) 


para el segundo orden de aproximación. 

Algunas veces nos interesan transiciones a” > a” para las que el elemento 
<a”|V*la”> es nulo o bien es pequeño comparado con los otros elementos 
de la matriz de V*. En estos casos es necesario trabajar con un orden de 
aproximación mayor. Si solamente conservamos los términos T* y T*, para 
a” a” resulta j j 


luego, 


Pla'a”) = hi ] cavar de — 


2 


an y [<ervrejar a J Cervera de]. (26) 
ama, at 
Los términos correspondientes a 4” = qe! y a” = a” los hemos omitido 
en la suma porque teniendo en cuenta que <a”|V*|a”> es pequeño, resultan 
pequeños comparados con los demás de la suma. A fin de interpretar el 
resultado (26) podemos suponer que el término 


| <arivs(eJa> de (27) 


t, 


da cuenta de una transición directa desde el estado «' al estado q”, mien- 
tras que el término 


t 1! 
—ih j <A Va dv | <Q EN a> dt” (28) 
t t 


0 0 


da cuenta de una transición desde el estado a” al estado a”” seguida de una 
transición desde dicho estado a” al estado a”. En esta interpretación el 
estado a” se denomina estado intermedio. Tenemos que sumar el térmi- 
no (27) con los diversos términos (28) correspondientes a los distintos ssta- 
dos intermedios, y tomar el cuadrado del módulo de dicha suma, lo que nos 
dice que hay interferencia entre los distintos procedimientos de transición 
— la transición directa y todas las que se verifican a través de estados 
intermedios — y por tanto, no podemos asignar ningún significado a la 
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probabilidad de que ocurra cada uno de dichos sucesos por separado. Sin 
embargo, existe una amplitud de probabilidad para cada uno de ellos. 
Estudiando el método de perturbaciones con órdenes de aproximación más 
elevados, llegamos a resultados que se pueden interpretar análogamente 
mediante procesos de transición más complicados que llevan consigo una 
sucesión de estados intermedios. 


45. Aplicación a la radiación 


En la sección anterior hemos desarrollado una teoría general de pertur- 
baciones de un sistema atómico, en la que la energía de perturbación podía 
variar con el tiempo de forma totalmente arbitraria. En la práctica pode- 
mos producir una perturbación de este tipo haciendo incidir sobre el sis- 
tema energía electromagnética. Veamos a qué se reduce el resultado (24) en 
este caso. 

Si despreciamos los efectos del campo magnético de la radiación inci- 
dente, y si además, suponemos que las longitudes de onda de las compo- 
nentes armónicas de dicha radiación son grandes en comparación con las 
dimensiones del sistema atómico, entonces la energía de perturbación es 
simplemente el producto escalar 


V = (D €), (29) 
siendo D el desplazamiento eléctrico total del sistema y € el campo eléc- 
trico de la radiación incidente. Supongamos que € es una función del tiem- 
po conocida. Si para simplificar suponemos que la radiación incidente 
está polarizada rectilíneamente con su vector campo eléctrico orientado 
en una determinada dirección, llamando D a la componente cartesiana 


de D en dicha dirección, la expresión (29) de V se reduce entonces al 
producto ordinario 


V =D€, 


siendo € la magnitud del vector €. Los elementos de matriz de V serán 
entonces 


<A Vla> = <a “DIE, 


ya que É es un número. El elemento de matriz <a"|Dla”> es independiente 
del tiempo t. Según (18), 


<a" [Ve (t)la> = <a"[Dlja)e UE 4=19/8 8(p), 


con lo que la expresión (24) para la probabilidad de transición nos da 


É 2 
Pla'a””) ás h?] <a" |Dla> |? [estrena to/n 8 (0) de (30) 


t, 
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Si analizamos la radiación incidente durante el intervalo de tiempo de 
to a t en sus componentes de Fourier, la energía que atraviesa la uni- 
dad de área por unidad de intervalo de frecuencia para la frecuencia y, 
según la electrodinámica clásica será 


t A 
l env Net) dt 2 (31) 


0 





Comparando este valor con (30), obtenemos 


Plata”) = 2rc "1H 72| <a"IDla”> P.E,, (32) 
siendo 


y = |E"—EN/h. (33) 


Según este resultado vemos que en primer lugar la probabilidad de 
transición únicamente depende de la componente de Fourier de la radia- 
ción incidente cuya frecuencia v está relacionada con el cambio de ener- 
gía por (33). (33) nos da la condición de Bohr para la frecuencia y nos indica 
en qué forma pueden ser incluidas en la mecánica cuántica las ideas de 
Bohr, precursor de la misma. | 

La teoría elemental que hemos expuesto no nos indica nada acerca de 
la energía del campo de radiación. Sin embargo, sería lógico suponer que la 
energía absorbida o liberada por el sistema atómico en el proceso de transi- 
ción procede de la componente de la radiación de frecuencia y dada por (33) 
o va a parar a ella, Esta hipótesis quedará justificada con una teo- 
ría de la radiación más completa que expondremos en el capítulo X. A la 
luz de ella, el resultado (32) debe ser interpretado como la probabilidad 
de que, si el sistema estaba inicialmente en el estado de menor energía, 
absorba radiación y pase al estado de mayor energía, y si inicialmente se 
encontraba en dicho estado, sea estimulado por la energía de radiación a 
emitir y pasar al estado de menor energía. La teoría aquí expuesta tampoco 
explica el hecho experimental de que cuando el sistema está en el estado 
de energía superior puede emitir radiación espontáneamente en ausen- 
cia de radiación incidente y pasar al estado de energía inferior, pero esto 
también queda explicado por la teoría de la radiación más completa del 
capítulo X. 

La existencia del fenómeno de emisión estimulada fue inferida por 
Einstein + mucho antes del descubrimiento de la mecánica cuántica, a partir 
de una consideración de equilibrio estadístico entre los átomos y el cam- 
po de radiación del cuerpo negro que verificaba la ley de Planck. Einstein 
demostró que la probabilidad de transición para la emisión estimulada tenía 


it  EsnstTElN, Phys. Zeits., 18 (1917), 121. 
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que ser igual a la de absorción entre el mismo par de estados, resulta- 
do que está de acuerdo con la teoría cuántica aquí expuesta, y asimismo 
dedujo una relación entre dicha probabilidad de transición y la de emisión 
espontánea, que está de acuerdo con la teoría del capítulo X. 

El elemento de matriz <a“|Dla'> de (32) hace el papel de la amplitud 
de una de las componentes de Fourier de D en la teoría clásica de un sis- 
tema múltiplemente periódico en interacción con la radiación. De hecho, la 
idea de sustituir las componentes de Fourier clásicas por elementos de 
matriz fue lo que condujo a Heisenberg al descubrimiento de la mecánica 
cuántica en 1925, Heisenberg supuso que las fórmulas que describen la 
interacción de un sistema con la radiación en mecánica cuántica podian 
ser obtenidas sustituyendo las componentes de Fourier del desplazamiento 
eléctrico total del sistema que figura en las fórmulas clásicas, por los co- 
rrespondientes elementos de matriz. Si aplicamos esta hipótesis a la emisión 
espontánea, un sistema con un momento eléctrico total D que estuviera en 
el estado a”, tendría que emitir radiación de frecuencia y = (E — E)/R, 
siendo E” un nivel de energía correspondiente a un estado a” tal que 
E” < E”, en la proporción 

D sr) 14 

2 e arioja y. (34) 

3 Ca | 
por unidad de tiempo. La distribución de dicha radiación según las dis- 
tintas direcciones de emisión y el estado de polarización para cada dirección 
serían iguales que para un dipolo eléctrico clásico de momento igual a la 
parte real de <a”[Dla”>. Para interpretar esta densidad de emisión de 
energía radiante por unidad de tiempo como una probabilidad de transi- 
ción tenemos que dividirla por el cuanto de energía correspondiente a dicha 
frecuencia, o sea por hy, y el resultado será la probabilidad de que dicho 
cuanto sea emitido espontáneamente en la unidad de tiempo, pasando si- 
multáneamente el sistema al estado a” de menos energía. Estas hipótesis 
quedan justificadas con la teoría de la radiación que hemos expuesto aquí 
completada con la teoría de las transiciones espontáneas del capítulo X. 


46. Transiciones producidas por una perturbación independiente del tiempo 


El método de perturbaciones de $ 44 sigue siendo válido cuando la 
energía V no es función explícita del tiempo t. Dado que en este caso el 
hamiltoniano total H no sería función explícita de t, podríamos emplear si 
quisiéramos el método de $ 43 y hallar sus estados estacionarios. La utili- 
dad de este método dependerá de lo que queramos conocer del sistema. 
Si hemos de calcular algo que hace referencia explícita al tiempo, como, 
por ejemplo, la probabilidad de que el sistema esté en un cierto estado 
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en un instante sabiendo que en otro instante está en otro estado, será más 
adecuado al método de $ 44. 

Veamos en qué se convierte el resultado (24) para la probabilidad de 
transición cuando V no es función explícita de t, tomando to = O para sim- 
plificar la notación. Ahora el elemento de matriz <a”[Vla”> es independiente 
de t, y según (18) 


<a V*(Mla> e <a Vja >e t(E—ENt/A, (35) 
de modo que | 


NE"-—Et/h ES 1 


É 
INV la? de = á EE XA 
e Val) de = <e Vi 


siempre que E” E', Luego, la probabilidad de transición (24) será 


Plata”) = |<a”Vla> Per 2Ent/n —1][e ie zova —1]/(E" —E'Y? 
= 2 <a”"IVla”> |?[1 — cost(E” — E” M/FR]/ E” — E"]?. (36) 


Si E” es muy diferente de E' dicha probabilidad de transición es pe- 
queña y se mantiene pequeña para todos los valores de t. Este resultado 
viene impuesto por la ley de la conservación de la energía. La energía 
total H es constante, y por tanto, la energía propia E (es decir, la energía 
que se obtiene despreciando la parte V debida a la perturbación) por ser 
aproximadamente igual a H, ha de ser aproximadamente constante. Esto 
quiere decir que si E tenía inicialmente el valor numérico E”, únicamente 
existirá una pequeña probabilidad de que en un instante posterior tenga 
un valor numérico considerablemente distinto de E”. 

En cambio, cuando el estado inicial a” es tal que existe otro estado a” 
con la misma o casi la misma energía propia E, la probabilidad de una tran- 
sición al estado final a” puede ser bastante grande. El caso que tiene interés 
físico es aquel en que existe un conjunto continuo de estados finales a” 
que poseen niveles de energía propia E” que contienen el nivel de ener- 
gía propia E' del estado inicial. Dicho estado inicial no tiene por qué 
formar parte de la serie de estados del conjunto continuo, sino que puede 
ser un estado discreto aislado o también un estado perteneciente a otro 
conjunto de estados continuos. Recordando las reglas de $ 18 para la 
interpretación de amplitudes de probabilidad referentes a conjuntos con- 
tinuos de estados, si P(a'a””) tiene el valor (36), la probabilidad de que haya 
una transición a un estado final comprendido en el pequeño intervalo de a” 
a a' + da” será P(a'a”)da” cuando el estado incial a sea discreto, y será 
proporcional a dicho valor cuando a? pertenezca a un conjunto continuo. 

Supongamos que los a que nos sirven para designar el estado final son E 
y un conjunto de otras variables dinámicas f, y así tendremos una repre- 
sentación análoga a la de $ 43 en el caso en que hay degeneración. (Sin 
embargo, las £ no tienen por qué tener significado para el estado inicial o.) 
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Para concretar supondremos que las 8 sólo tienen autovalores discretos. 
La probabilidad total de que haya una transición a un estado final a” para 
el cual las £ tienen los valores 8” y E tiene un valor cualquiera (habrá 
una gran probabilidad cuando el estado final tenga una energía propia muy 
próxima a la E' del estado inicial) será (o bien será proporcional a) 


| Píaa”) az” 


= 2 | |<E"g"Vja”> 211 —cos((E” — ER) N(E" — E”? dE” (37) 


= 2h | |<E + fix/t, 8UVja> P?[1—cos 1]/2% dx 


si hacemos la sustitución (E — E%t/h = x. Para grandes valores de t se 
reduce a 


2h 2]<E'B"VIdZ> PP ! [1 — cos x]/x? dx 
] = 2th<E'BUVi> 2. (88) 


Luego, la probabilidad de que tenga lugar una transición al estado final 
en el que las £ tengan los valores 8” durante el intervalo de O a t es pro- 
porcional a t. Existe, por lo tanto, un coeficiente de probabilidad definido, 
o sea, una probabilidad por unidad de tiempo determinada, para el proceso 
de transición considerado, que tiene el valor 


2h "| <E'B"V]a”> [?. (39) 


Es proporcional al cuadrado del módulo del elemento de matriz de la 
energía de perturbación asociado con dicha transición. 

Si el elemento de matriz <E'B"|Vla'> es pequeño en comparación con 
los otros elementos de matriz de V, tendremos que hacer el estudio con la 
fórmula más precisa (26). Según (35), tenemos 

t y 
| <evsejar> ar | caen) ar 
0 


0 
É $ 


=<0Va"> a Vja> | exrremo/a ay f ENEV-EN A gy 
0 

<a vV] > ao <a V| an 
=— (E En E5/R 


[CUENENPIA ¿EN 18/83 q, 


Si E” es próximo a E”, únicamente el primer término que figura bajo el 
signo integral en la fórmula anterior da cuenta de una probabilidad de 
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transición con importancia física, en cambio, el segundo puede ser despre- 
ciado. Utilizando este resultado en (26) obtenemos 


Pla a”) 
<a Via "><ad"lVia> |? 1—cos ((E”" — ENt/h; 
— 2 |<a[Vla'> — y) UA LA 1 cos E" 
an, ar? E” Ss E” (E” > E”) Ñ 








que sustituye a (36). Procediendo igual que antes, obtenemos para la pro- 
babilidad de transición por unidad de tiempo a un estado final en el que 
las £ tienen los valores £” y E tiene un valor próximo a su valor inicial E”, 
el valor 

2 


<E'B"IVia””> <a" Vla”> 
E” as E' 


2 
sc <E'B"V] a» E ya ( 40) 


wz a ar 








Esta fórmula nos muestra el papel que juegan los estados intermedios dis- 
tintos del estado inicial y del final en la determinación de un coeficiente de 
probabilidad. 

Para que las aproximaciones utilizadas al deducir (39) y (40) sean váli- 
das, el tiempo t no ha de ser ni muy pequeño ni muy grande. Tiene que 
ser grande comparado con los períodos de los sistemas atómicos a fin de que 
el cálculo aproximado de la integral (37) conduzca verdaderamente al 
valor (38), pero no ha de ser excesivamente grande, pues en tal caso la 
fórmula general (24) o (26) dejaría de ser válida. De hecho, podríamos hacer 
la probabilidad (38) mayor que la unidad si tomásemos un tiempo suficien- 
temente grande. El límite superior de t viene determinado por la condición 
de que la probabilidad (24) o (26), o bien t multiplicado por (39) o (40), sean 
pequeñas en comparación con la unidad. No hay dificultad para que t 
satisfaga simultáneamente ambas condiciones siempre que la energía de 
perturbación V sea suficientemente pequeña. 


47. El efecto Zeeman anómalo 


Uno de los ejemplos más sencillos del método de perturbaciones de $ 43 
consiste en calcular el cambio de primer orden en los niveles de energía 
de un átomo producido por un campo magnético uniforme. En $ 41 hemos 
estudiado ya el caso del átomo de hidrógeno, y era tan sencillo que lo 
hemos podido resolver sin recurrir a la teoría de perturbaciones. El caso 
de un átomo cualquiera no es mucho más complicado si previamente 
hacemos una serie de aproximaciones que nos proporcionen un modelo 
atómico sencillo. 
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En primer lugar consideremos el átomo en ausencia de campo magné- 
tico y busquemos constantes del movimiento o cantidades que sean aproxi- 
madamente constantes del movimiento. Ciertamente, el momento angular 
total del átomo, o sea el vector j, es una constante del movimiento. Dicho 
momento angular puede ser considerado como la suma de dos partes, que 
son el momento angular orbital total para todos los electrones, que llama- 
remos l, y el momento angular total de spin, que llamaremos s. Tenemos, 
pues, j = 1+s. Pero el efecto de los momentos magnéticos de spin sobre 
el movimiento de los electrones es pequeño en comparación con el efecto 
de las fuerzas de Coulomb, y en primera aproximación puede ser despre- 
ciado. En dicha aproximación el momento angular de spin de cada electrón 
es una constante del movimiento, ya que no hay fuerzas que le obliguen 
a cambiar su orientación. Así pues, s, y, por tanto, también 1 serán cons- 
tantes del movimiento. Los módulos l, s y ¿ de l, s y j vendrán dados por 


L+ 3% = (04 4224482), 
+ 3h = (3454824 4%) 
+ dh = (MARA RRA 


según la ecuación (39) de $ 36. Todos ellos conmutan entre sí, y según (47) 
de $ 36 vemos que para valores de 1 y s dados, los posibles valores de j son 


bb: Ds = Rip Vezal 


Consideremos un estado estacionario para el cual l, s y ¡ tengan valores 
numéricos de acuerdo con este esquema. La energía de dicho estado de- 
penderá de l, pero podría pensarse que despreciando los momentos magné- 
ticos del spin no tendría que depender ni de s ni de la dirección relativa 
del vector s respecto a 1, es decir, que tampoco habría de depender de j. 
Sin embargo, veremos en el capítulo IX, que la energía depende conside- 
rablemente del módulo s del vector s, si bien es independiente de su diree- 
ción cuando se desprecia el efecto de los momentos magnéticos del spin 
debido a ciertos fenómenos que se derivan de la indistinguibilidad de los 
electrones entre sí. Así pues, existen distintos niveles de energía del sistema 
para cada valor distinto de ! y de s. Esto significa que tanto | como s son 
funciones de la energía según la definición general de función dada en $ 11. 
pues los valores de 1 y de s de un estado estacionario quedan fijados cuando 
se da el valor de la energía. 

Ahora podemos tener en cuenta el efecto del momento magnético de 
spin, considerándolo como una pequeña perturbación según el método 
de $ 43. La energía del sistema no perturbado continuará siendo aproxima- 
damente una constante del movimiento, y en consecuencia, tanto | como s, 
por ser funciones de la energía, seguirán siendo también aproximadamente 
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constantes del movimiento. Pero en cambio, las direcciones de los vecto- 
res l y s, como no son funciones de la energía no perturbada, no tienen 
por qué ser ahora constantes del movimiento ni siquiera en primera apro- 
ximación, y pueden estar sometidas a grandes variaciones seculares. Pero 
como el vector j es constante, la única variación posible de 1 y s es un 
movimiento de precesión en torno del vector j. Así tenemos un modelo 
aproximado del átomo en el cual los dos vectores 1 y s tienen longitudes 
constantes y poseen un movimiento de precesión en torno al vector suma 
de ellos j, que es constante. La energía está determinada principalmente 
por los módulos de 1 y de s, y sólo depende ligeramente de la orientación 
relativa, dada por j. Por tanto, los estados con el mismo l el mismo s y 
distinto j pertenecerán a niveles de energía que diferirán muy poco y que 
constituyen los llamados términos multipletes. 

Consideremos ahora este modelo atómico como nuestro sistema no per- 
turbado y sometámoslo a un campo magnético uniforme de magnitud MY 
en la dirección del eje z. La contribución de cada electrón a la energía 
extra debida al campo magnético vendrá dada por un término 


eH/2mc . (m, + h 9), (41) 


análogo al último término de la ecuación (89) de $ 41. Así pues, en conjunto 
dicha energía será 


cH/2mc - Y (m, + ho) = cH/2mc . (l, + 25.) = eH/2mc. (ja + 82). (42) 


que será la energía de perturbación V. Utilicemos ahora el método de $ 43 
para determinar los cambios de los nivéles de energía producidos por 
dicha V. El método únicamente será aplicable cuando el campo magnético 
sea suficientemente pequeño para que V sea pequeño comparado con las 
diferencias de energía del multiplete. 

Nuestro sistema no perturbado es degenerado, dado que la dirección 
del vector j está indeterminada. Por tanto, hemos de tomar aquellos ele- 
mentos de matriz del representante de V en una representación de Heisen- 
berg del sistema no perturbado, que pertenecen a un mismo nivel de ener- 
gía respecto a filas y columnas, y hallar los autovalores de la matriz asi 
formada. La forma más cómoda de hacerlo es separar V en dos partes, 
una que sea constante del movimiento del sistema no perturbado cuyo 
representante, en consecuencia, sólo tendrá elementos de matriz que co- 
respondan a un mismo nivel de energía respecto a filas y a columnas, y 
otra cuyo representante no contenga más que elementos de matriz que 
hagan referencia a dos niveles de energía del sistema no perturbado dis- 
tintos respecto a filas y a columnas, y que en consecuencia no afectará a la 
perturbación de primer orden. El término relativo a j. en (42) es una cons- 
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tante del movimiento no perturbado, y por tanto pertenece enteramente a 
la primera parte. Para el término relativo a s, tenemos 


sí 0 F, AE 12) a AScja EN Suu SP S¿j2) =P (Seo ES J2S.2) le as (Say A. JeSy) lv 
o sea, 
de 
= E * 
donde 


(¡+7%)—Ul 4h) +s(s + ñ)] — [Y jo — Y ful Y mA AS) 


E 


Ya = Sdy—feSy = Sely — l.Sy = lySz — LoSy, 


» > 44 
Yv = JS2— $da = l¿Sq — Sala = l¿Sa — l582, j ) 


El primer término de la expresión de s, es una constante del movimiento 
no perturbado y, por tanto, pertenece enteramente a la primera parte, mien- 
tras que el segundo término pertenece por completo o la segunda parte como 
vamos a ver a continuación. 

En correspondencia con (44), podemos introducir 


Ja — l¿sy — lySz. 


Es fácil comprobar ahora que 


joYo + ÍyYv + 1Y2 = O 
y según (30) de $ 35 


je, Ya) = Yy je, Yy) = — Yz yA y] =0, 


Estas relaciones entre jz, jy, je Y Ya, Yy, Y. son de la misma forma que las 
relaciones entre M., M,, M, Y X, Y, Z que aparecían en el cálculo de las reglas 
de selección para los elementos de matriz de z en una representación con k 
diagonal que hicimos en $ 40. Allí obtuvimos el resultado de que todos los 
elementos de matriz z eran nulos excepto los que hacían referencia a 
los valores de k que diferían en =%; así pues, podemos inferir que todos los 
elementos de matriz de y, en una representación con k diagonal, y análo- 
gamente los de y, y y,, son nulos, excepto aquellos que corresponden, a 
valores de ¡ que difieren en =%. Los coeficientes de Y, y Y, del segundo 
miembro de (43) conmutan con j; y así, el representante del conjunto de 
dichos términos no contendrá más elementos de matriz que los que corres- 
pondan a valores de j que difieren en +%, y que, por tanto, correspondan a 
dos niveles de energía del sistema no perturbado distintos. 

Luego, si despreciamos la parte de la energía V cuyo representante 
consta de elementos de matriz que hacen referencia a dos niveles de ener- 
gía del sistema no dia distintos, la energía de perturbación es 


AS RAR — MU) ls + %)) 


2mo pr 21( + h) j 50 
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Los autovalores de este operador dan los cambios de primer orden de los 
niveles de energía. Podemos hacer que el representante de dicha expresión 
sea diagonal, eligiendo la representación de tal manera que j, sea diagonal, 
y entonces dicha fórmula nos da directamente los cambios de primer orden 
en los niveles de energía producidos por el campo magnético. Esta expre- 
sión se conoce con el nombre de fórmula de Landé. 

El resultado (45) es válido únicamente si la energía de perturbación V 
es pequeña en comparación con las diferencias de energía de un multiplete. 
Para valores de V mayores es necesario emplear una teoría más complicada. 
Sin embargo, para campos muy fuertes, cuya energía sea mucho mayor que 
la correspondiente a las diferencias entre los términos de un multiplete, 
es posible establecer nuevamente una teoría sencilla. En este caso podemos 
despreciar la energía de los momentos magnéticos de spin para el átomo 
en ausencia de campo magnético exterior, con lo que resulta que en el 
sistema no perturbado de ahora no sólo son constantes los módulos l y s 
de los vectores 1 y s, sino también los propios vectores 1 y s. La energía de 
perturbación V sigue siendo como antes eX/2mc . (j¿ + S,), pero ahora es 
una constante del movimiento del sistema no perturbado y sus autovalores 
nos dan directamente los cambios de los niveles de energía. Dichos auto- 
valores son múltiplos enteros o bien múltiplos impares semienteros de 
eXt/2mc según que el número de electrones del átomo sea par o impar. 
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PROBLEMAS DE COLISIÓN 


48. Observaciones generales 


En este capítulo vamos a estudiar problemas en los que una partícula 
que proviene del infinito choca o “entra en colisión” con un sistema atómico, 
y que tras ser dispersada (scattered) bajo un cierto ángulo continúa nueva- 
mente hacia el infinito. Para abreviar, al sistema atómico que produce la 
dispersión (scattering) le llamaremos dispersor (scatterer). Por tanto, tenemos 
un sistema constituido por una partícula incidente y un dispersor que 
interaccionan entre sí, y queremos estudiarlo de acuerdo con las leyes de 
la mecánica cuántica; deseamos calcular en particular la probabilidad 
de que la dispersión se realice bajo un ángulo dado. Normalmente se 
supone que el dispersor tiene masa infinita y que permanece en reposo 
durante el proceso de dispersión. Este problema fue resuelto por primera 
vez por Born mediante un método que en lo fundamental es equivalente 
al que emplearemos en la próxima sección. Hemos de tener en cuenta la 
posibilidad de que el dispersor considerado como un sistema independiente 
tenga distintos estados estacionarios, y que si inicialmente estaba en uno 
de ellos, después de la colisión puede haber quedado en. un estado estacio- 
nario distinto. Es decir, que la partícula incidente puede inducir transicio- 
nes en el dispersor. 

El hamiltoniano del sistema total constituido por el dispersor y la 
partícula incidente no será función explícita del tiempo y, en consecuencia, 
el sistema total poseerá estados estacionarios representados por soluciones 
periódicas de la ecuación de ondas de Schródinger. Pero el significado de 
estos estados estacionarios requiere un poco de cuidado para ser entendido 
correctamente. Es evidente que para cualquier estado de movimiento 
del sistema, la partícula pasará casi todo el tiempo en el infinito y, por 
tanto, el promedio temporal de la posibilidad de encontrar a la partícula 
en un volumen finito cualquiera será nulo. Ahora bien, para un estado 
estacionario la probabilidad de que la partícula se encuentre en un volumen 
finito dado, así como cualquier otra observación, ha de ser independiente 
del tiempo y, por tanto, ha de ser igual al promedio temporal que como 
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hemos visto es nulo. Por tanto, lo único que tiene interés fisicamente son 
las probabilidades relativas de encontrar la partícula en los diferentes 
volúmenes finitos, ya que sus valores absolutos son nulos. Dado que la 
energía inicial de la partícula podía ser cualquiera, la energía total del 
sistema tendrá un espectro de autovalores continuo. Luego, un ket |s> 
correspondiente a un estado estacionario de la energía total tendrá longitud 
infinita. También podemos dar una razón física de ello, y es que si |s> 
estuviese normalizado y si Q es un observable — función de la posición 
de la partícula — que vale uno cuando la partícula está en un volumen 
finito dado y cero en cualquier otro caso, <s|Q|s> sería cero, lo que signifi- 
caría que el valor esperado de OQ, o sea, la probabilidad de que la partícula 
esté en un determinado volumen, es cero. Tal ket no sería útil. Sin em- 
bargo, si |[s> tiene longitud infinita, <s[Ols> puede ser un número finito, y 
representará la probabilidad relativa de que la partícula se encuentre en el 
citado volumen. 

Cuando representamos el estado de un sistema por un ket ¡x> no nor- 
malizado para el cual se verifica <x[x> = n, es conveniente suponer que 
tenemos n sistemas idénticos que ocupan todos el mismo espacio pero que 
no interaccionan entre sí, de manera que cada uno de ellos sigue su propio 
movimiento independientemente de los otros, igual que en el conjunto de 
Gibbs de $ 33. En ese caso podemos interpretar <xlalx> para cualquier 
observable a, directamente como el valor total de « para los n sistemas. 
Si aplicamos estas ideas al |s> de antes de longitud infinita correspondiente 
a un estado estacionario del sistema constituido por el dispersor y la partí- 
cula inciden, tendremos que imaginar un conjunto infinito de dichos 
sistemas que tengan todos ellos el dispersor en el mismo punto del espacio 
y las partículas distribuidas por todo el espacio de forma continua. El nú- 
mero de partículas en el volumen finito dado será entonces <s]Q|s>, en 
donde Q es el observable definido antes, que vale uno si la partícula se 
encuentra en el volumen dado y cero en cualquier otro caso. Si el ket está 
representado por una función de onda de Schródinger relativa a las coor- 
denadas cartesianas de la partícula, entonces el cuadrado del módulo de la 
función de onda puede ser interpretado directamente como la densidad 
de partículas en dicha imagen. Sin embargo, debemos recordar que cada 
una de dichas partículas tiene su propio dispersor. Las distintas partículas 
pueden pertenecer a dispersores que están en estados diferentes. Por tanto, 
existirá una densidad de partículas distintas para cada estado del dispersor, 
que será la densidad de partículas que pertenezcan a dispersores que estén 
en dicho estado, Esto lo tendremos en cuenta considerando que la función 
de onda es función no sólo de las variables que describen la posición de la 
partícula, sino también de las que describen el estado del dispersor. 

Para hallar coeficientes de dispersión tendremos que estudiar los estados 
estacionarios del sistema total constituido por el dispersor y la partícula. 
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Por ejemplo, si queremos hallar la probabilidad de que la dispersión se 
realice según las distintas direcciones cuando el dispersor esté inicialmente 
en un estado estacionario dado y la partícula tenga inicialmente una 
velocidad conocida en una dirección también dada, tendremos que estu- 
diar el estado estacionario del sistema total cuya imagen, según el método 
indicado, represente únicamente partículas pertenecientes a dispersores que 
estén cada uno en el estado estacionario dado, que a grandes distancias 
del lugar en que se hallan los dispersores se muevan con la velocidad dada 
y en la dirección dada, y partículas que pertenezcan posiblemente a dis- 
persores en distintos estados estacionarios, que se muevan hacia afuera a 
partir del punto en que se hallan los dispersores. Esta imagen corresponde 
muy de cerca al estado de cosas real en una determinación experimental 
de los coeficientes de dispersión, con la única diferencia de que dicha 
imagen describe ahora un único sistema real constituido por dispersor y 
partícula. La distribución de las partículas que se mueven hacia afuera en 
el infinito nós da directamente, en la imagen, toda la información que se 
puede obtener experimentalmente acerca de los coeficientes de dispersión. 
Para calcular prácticamente el estado estacionario descrito en esta imagen, 
podemos utilizar un método de perturbaciones parecido al de $ 43, por ejem- 
plo tomando como sistema no perturbado el sistema constituido por el 
dispersor y la partícula sin interacción entre ambos. 

Estudiando los problemas de colisión, hay todavía otra posibilidad que 
debemos tener en cuenta, y es que el dispersor puede ser capaz en algunas 
ocasiones de absorber y reemitir la partícula. Dicha posibilidad se da 
cuando existen uno o más estados de absorción del sistema total, o sea 
estados que sean aproximadamente estacionarios y ligados en el sentido 
que indicábamos en $ 38 (es decir, para los que la probabilidad de que la 
partícula se encuentre a una distancia del dispersor mayor que r tiende a 
cero cuando r > «). Como los estados de absorción sólo son estacionarios 
aproximadamente, su propiedad de ser estados ligados solamente será tran- 
sitoria, y después de un lapso de tiempo suficiente existirá una probabilidad 
finita de que la partícula escape al infinito. Físicamente esto quiere decir 
que habrá una probabilidad finita de que la partícula sea emitida espon- 
táneamente. El hecho de que haya sido preciso emplear la palabra “apro- 
ximadamente” para explicar las condiciones requeridas para que puedan 
ocurrir los fenómenos de emisión y absorción indica que dichas condiciones 
no se pueden expresar en términos matemáticos exactos. Únicamente pode- 
mos dar un significado a dichos fenómenos utilizando un método de per- 
turbaciones. Dichos fenómenos ocurren cuando el sistema no perturbado 
(constituido por el dispersor y la partícula) tiene estados estacionarios liga- 
dos. La introducción de la perturbación destruye las propiedades estacio- 
narias de dichos estados y da lugar a la emisión espontánea y al fenómeno 
contrario de la absorción. 
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Contrariamente a lo que ocurría para los coeficientes de dispersión, 
para calcular probabilidades de absorción y de emisión es necesario con- 
siderar estados no estacionarios, y, en consecuencia, tendremos que utilizar 
el método de perturbaciones de $ 44. Por lo tanto, para calcular un coefi- 
ciente de emisión, tendremos que considerar los estados de absorción no 
estacionarios que hemos mencionado antes. Además, puesto que toda absor- 
ción va seguida siempre de una reemisión, dicho fenómeno no puede ser 
separado de la dispersión en ningún experimento que no dependa del 
tiempo explícitamente, correspondiente a un estado estacionario del sis- 
tema. Únicamente podemos separar los dos fenómenos en experimentos en 
que el estado de cosas no se conserva. Por ejemplo, utilizando un haz de 
partículas incidentes con un comienzo de emisión claramente definido, y 
así las partículas dispersadas aparecerán inmediatamente después de que las 
partículas incidentes hayan alcanzado el dispersor, mientras que las que 
hayan sido absorbidas y después reemitidas aparecerán sólo algún tiempo 
después. Dicho haz de partículas sería la imagen de un cierto ket de lon- 
gitud infinita, que puede ser empleado para calcular el coeficiente de 
absorción. 


49. Coeficiente de dispersión 


Ahora vamos a calcular coeficientes de dispersión, y en primer lugar 
estudiaremos el caso en que no hay absorción ni emisión, lo que quiere 
decir que el sistema no perturbado no tiene estados estacionarios ligados. 
Podemos elegir como sistema no perturbado aquel para el cual no hay 
interacción entre el dispersor y la partícula. Su hamiltoniano será de la 


forma 


donde H, es el hamiltoniano del dispersor considerado él sólo, y W es el 
de la partícula considerada ella sola. Si despreciamos la mecánica relativista 
este último vale 


W = 1/2m. (pi + p;, + Pp). (2) 


La energía de perturbación V, que suponemos pequeña, será una función 
de las coordenadas cartesianas de la partícula x, y, z y también quizá de 
sus momentos Pz, Py, P2¿ y de las variables dinámicas que sirven para des- 
cribir el dispersor. 

Puesto que lo que nos interesa son los estados estacionarios del sistema 
total, emplearemos un método de perturbaciones parecido al de $ 43. Pero 
ahora nuestro sistema no perturbado tendrá necesariamente un intervalo 
de niveles de energa continuo, pues contiene una partícula libre, y por 
tanto, tendremos que hacer ciertas modificaciones en nuestro método de 
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perturbaciones. La cuestión de cómo cambian los niveles de energía debido 
a la perturbación, que era la base del problema estudiado en $ 43, no 
tiene “ahora significado alguno, y el convenio utilizado en $ 43 de designar 
los autovalores de E y de H próximos entre sí con el mismo número de 
primas es inaplicable. Además, el desdoblamiento de los niveles de energía 
que tenía lugar en $ 43 cuando el sistema no perturbado era degenerado 
tampoco puede ocurrir ahora, pues cuando el sistema no perturbado sea 
degenerado, el sistema perturbado deberá tener el mismo grado de dege- 
neración, ya que ha de tener un intervalo de niveles de energía continuo. 

Continuaremos utilizando el esquema general de ecuaciones del princi- 
pio de $ 43, que allí correspondía a las ecuaciones (1) a (4); pero ahora 
tomaremos como estado estacionario del sistema no perturbado que cons- 
tituye la aproximación de orden cero un estado que pertenezca a un nivel 
de energía E” precisamente igual al nivel de energía H” del estado esta- 
cionario del sistema perturbado. Luego, las a; introducidas en la segunda 
de las ecuaciones (3) de $ 43 serán ahora todas nulas, y la segunda de las 
ecuaciones (4) se convertirá en 


(E — EL = V]|0>. (3) 
Análogamente, la tercera de las ecuaciones (4) de $ 43 será 
(El —E)2> = VID. (4) 


Procedamos a resolver la ecuación (3) y a obtener el coeficiente de disper- 
sión en la aproximación de primer orden. En $ 51 será preciso emplear la 
ecuación (4). 

Sea 4 un conjunto completo de observables que conmutan que sirven 
para describir el dispersor y que son constantes del movimiento cuando 
el dispersor se considera solo, siendo, por tanto, útiles para caracterizar 
los estados estacionarios del dispersor. Ello exige que H, conmute con los «a 
y que sea una función de ellos. Ahora podemos elegir una representación 
del sistema total en la que las a y las coordenadas de la partícula x, y, 2 
sean diagonales. En ella H, será también diagonal. Sea <xa“|0> el repre- 
sentante de |0>, y <xa'[1> el de |1>; empleamos la variable única x en lugar 
de x, y, z y omitimos la prima para abreviar. Asimismo escribiremos dx 
en lugar del producto dxdydz. La ecuación (3) escrita en forma de los 
representantes se convierte, con la ayuda de (1) y (2), en 


(El — Hsa') + h*/2m .V?)<x0 (12 = Y j <xa Vx" ">dix"<x"4"10>. (5) 
Supongamos que la partícula incidente tiene el momento p? y que el estado 
estacionario inicial del dispersor es «%. El estado estacionario de nuestro 
sistema no perturbado será el que corresponde a p = p* y a = al; luego, 
su representante será 


<xa'|0> = dar eto, ii (6) 
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y así la ecuación (5) se reduce a 


(E' — Hga) + h*/2m . V%<xa 11> = | <xa [V|x090)> 3x0 eip?, 209/8 


o sea, 


(2 + V2)<x0[1> = F, (7) 
donde 
k2 —= 2mh UE! — Hua”) (8) 
y 
F — 2mh"? j (xa [Vix000> dBx0ei”, 0/8 (9) 


es una función definida de x, y, z y a/. Asimismo resulta 
E” = Hua%) + p*/m. (10) 


Nuestro problema consiste en hallar una solución <xa'[1> de (7) que 
para valores de x, y, z correspondientes a puntos alejados del dispersor 
represente únicamente partículas que se muevan hacia afuera. El cuadrado 
de su módulo, | <xq]1> |?, nos dará la densidad de partículas dispersadas 
pertenecientes a dispersores que se hallen en el estado a” cuando la densi- 
dad de partículas incidentes es | <xxa"|0> |?, que es igual a uno. Si trans- 
formamos la ecuación (7) a coordenadas o r, 0, $, se convierte en 
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Pero teniendo en cuenta la exigencia física de que la energía de interacción 
entre el dispersor y la partícula ha de tender a cero cuando la distancia entre 
ambos tiende a infinito, F tenderá a cero cuando r > oo. Si ahora despre- 
ciamos E en (11), obtenemos la solución aproximada para grandes valo- 
res de r 


<rópa 1> == u(0pa jr te*rr, (12) 


donde u es una función arbitraria de 9, $ y qa”, pues si sustituimos esta 
expresión en el primer miembro de (11) obtenemos un resultado del orden 
de r”3. Si no despreciamos F, para valores grandes de r la solución de (11) 
seguirá siendo de la forma (12), siempre que F tienda a cero suficientemente 
de prisa cuando r > oo, pero la función u quedará definida y determinada 
por la solución para valores de r pequeños. 

Para valores a” de a tales que k* definido en (8) sea positivo, hemos de 
elegir el k de (12) igual a la raíz cuadrada positiva de k* si queremos 
que (12) represente únicamente partículas que van hacia afuera, es decir, 
partículas para las cuales la componente radial del momento, que según 
$ 38 vale p, —ifr”*, o sea, — iñ(0/0r + r”*), tenga un valor positivo. Con 
ello la densidad de partículas dispersadas pertenecientes a dispersores en 
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el estado «a, y que es igual al cuadrado del módulo de (12), disminuye 
según una ley inversamente proporcional al cuadrado del radio cuando r 
crece, como necesariamente tiene que ocurrir desde el punto de vista físico, 
y su distribución angular viene dada por | u(Gpa”) [?. Además, la magnitud 
P' del momento de las partículas dispersadas ha de ser igual a kh, pues 
para r grande el momento es radial; luego, su energía será 
2 242 02 
A El — Hala) = Hala?) — Hala”) + E, 
2m 2m 2m 





aplicando (8) y (10). Esta energía es precisamente igual a la de la partícula 
incidente p*/2m menos el aumento de energía del dispersador H,(w”) — 
— H.(a%), resultado que está de acuerdo con la ley le conservación de la 
energía. Para valores a” de « tales que k? resulte negativo, no hay par- 
tículas dispersadas, lo que significa que la energía total inicial es insufi- 
ciente para que el dispersor pase al estado q. 

Ahora hemos de calcular u(0pa') para un conjunto de valores a” de a 
para los que K2 sea positivo, y obtener así la distribución angular de las 
partículas dispersadas pertenecientes a dispersores en el estado o. Bastará 
con calcular u en la dirección 6 == O del polo de las coordenadas polares, 
pues dicha dirección puede ser elegida arbitrariamente. Haremos uso del 
teorema de Green, que dice que para dos funciones de la posición A y B 
cualesquiera, la integral de volumen f (AV2B — BV?A) d*x extendida a un 
volumen cualquiera es igual a la integral de superficie f (A0B/0n — 
BOA/0n) ds extendida a la superficie que limita a dicho volumen, en donde 
0/0n significa derivada respecto a la normal 'a la superficie. "Tomamos 


A = ertrcoso  B= <rópa [DD 


y aplicamos el teorema para una esfera de radio grande con centro en el 
origen. El integrando de la integral de volumen, según (7) u (11), es 

e +kr cos O V?2<rgpa'|1> ÉL, <ropa|1> V2grtker cos Y 

ce ever cus 0 (y? + k2)<r0pa|1> — e7ikr cos 0 F 


mientras que el integrando de la integral de superficie se convierte, me- 
diante (12), en 


—ékr cos € qe ; a 0 -ikr cos 0 
e <ropa!|1> — <repa|1> — e 
Or Or 


— grikr cos 9 yy / 1 ES E ik ] erp E eirk cos 0 e” *Er cos 0 
O r r 


= ikur (1 + cos B)e**r(1=cos 9) 
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despreciando r”?. Luego, resulta 
2N T 
f eres Pd | de j 1? sen 9 d9 .ikur”*(1 + cos 0)ettr(ocos 0), 
0 y 
en donde la integral de volumen del primer miembro está extendida a todo 
el espacio. Integrando por partes respecto a 6, el segundo miembro se 
transforma en 


gr T 
5 — — ir — =] O . | 

d / 1 ikr(1-co8 0) J0=xr idr(1-cos 0) 1 Os 6 de | 

$ | [u(1 + cos 6)e 13" — e A + cos 6)] y 


El segundo término que figura entre los paréntesis ( j es del orden de r”1, 
como puede verse mediante nuevas integraciones por partes y, por lo tanto, 
puede ser despreciado. Así pues llegamos a 


f gtr cos 9 Po dix —= —2 1 de u(0pa”) — — 4zu(0ba”), 
Ó 


que nos da el valor de u(0pa”) en la dirección 6 = O, 
Puesto que P” = kh, este resultado se puede escribir en la forma 


u(0pa”) — — (47)! 1 e 1P'r cos 0/4 PF dex, (13) 


Si el vector p' representa el momento de los electrones dispersados en una 
cierta dirección (y por tanto, tiene un módulo igual a P”), el valor de u en 
dicha dirección será 


ua) == — (41)? Jl e41P,0/ñ E d8x, 


según se deduce de (13) eligiendo dicha dirección como polo de las coor- 
denadas polares. Resulta pues, mediante (9), 


u(0 pa”) = — (27) mh"? f/ ep, x)/A ([$éx <xa V|x020> 3x0 cir? x0)/A 
= —2nmh<p'a'V|p*ao>, (14) 


después de hacer una transformación y pasar de las coordenadas x a los 
momentos p de la partícula utilizando la función de transformación (54) 
de $ 23. La letra p es una abreviación de las tres componentes del momento. 

Así, la densidad de partículas dispersadas que pertenecen a dispersores 
en el estado a' será | u(9 a”) 2/12. Como su velocidad es P"/m, el flujo de 
partículas por unidad de ángulo sólido y por unidad de tiempo en la 
dirección del vector p' será P'/m.| u(60'9'a”) |?. Como hemos visto, la densi- 
dad de partículas incidentes era igual a uno y, por tanto, el número de 
partículas incidentes que atraviesan la unidad de superficie en la unidad 
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de tiempo es igual a su velocidad P*%/m, siendo P* la magnitud de p. 
Luego, la sección eficaz para que una partícula incidente sea dispersada 
bajo un ángulo sólido unidad en la dirección de p” y que pertenezca a un 
dispersor en el estado a” será | 


P'/P9 (09 a)? = 4r2m2h?P"/Po | <pr¡Vipooo> ?. (15) 


Este es el coeficiente de dispersión relativo a las transiciones a? => a” del 
dispersor. Dicho coeficiente depende del elemento de matriz <p'a'¡V|p%a0> 
de la energía de perturbación V cuya columna p%x” y cuya fila p'a” se 
refieren respectivamente a los estados inicial y final del sistema no pertur- 
bado entre los que tiene lugar la transición. Así pues, el resultado (15) 
es análogo al resultado (24) de $ 44, si bien los coeficientes numéricos son 
distintos en ambos casos en correspondencia con la distinta naturaleza de 
los dos procesos de transición. 


50. Solución en la representación de momentos 


El valor del coeficiente de dispersión dado por (15) sólo hace referencia 
a la representación en que p es diagonal. Así pues, es de esperar que 
podríamos llegar a él de un modo más directo utilizando desde el principio 
la representación p en lugar de utilizar la representación x y transformar 
al final el resultado expresándolo en la representación p, tal como hemos 
hecho en $ 49. A primera vista no parece que esto constituya una gran 
ventaja, pues si bien el método de la representación x no resulta tan di- 
recto, ello queda compensado por ser más inmediatamente aplicable, ya 
que el cuadrado del módulo del representante de un estado en la repre- 
sentación x nos da la densidad del flujo de partículas en el proceso de 
dispersión. Sin embargo, el método de la representación x tiene otros 
inconvenientes más serios. Una de las principales aplicaciones de la teoría 
de colisiones corresponde al caso en que las partículas incidentes son 
fotones. Pero un fotón no es una partícula simple, pues tiene una pola- 
rización. Es evidente, a partir de la teoría electromagnética clásica, que un 
fotón con un momento definido, es decir, que se mueve en una cierta 
dirección con una frecuencia definida, puede tener un estado de polari- 
zación definido (rectilíneo, circular, etc.), mientras que un fotón con una 
posición definida, cosa que en nuestra imagen quiere decir una alteración 
electromagnética confinada a un volumen muy pequeño, no puede tener 
un estado de polarización definido. Estos hechos vienen a decir que el 
observable polarización de un fotón conmuta con los momentos pero no 
con la posición. Esto se traduce en que el método de la representación p es 
directamente aplicable a fotones si introducimos la variable de polarización 
en los representantes y la tratamos del mismo modo que tratábamos a 
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los « que describen el dispersor, mientras que el método de la represen- 
tación x no se puede aplicar. Además, cuando se consideran fotones es 
necesario tener en cuenta la mecánica relativista. En el método de la repre- 
sentación p es fácil hacerlo, pero en el de la representación x no resulta 


tan fácil. 
La ecuación (3) sigue siendo válida en mecánica relativista, pero en 


ella W viene dada por 
W?/c? = méc 4 Pl = mé + po+ po + Pp; (16) 
en lugar de por (2). Escrita en forma de representantes p, la ecuación (3) es 
(E — Hsa) — Wi<po/11> = <pv|V¡0>, 


en donde para abreviar ponemos p en lugar de p' y sobreentendemos 
que W es una función determinada de p., Py y p. dada por (16). Esto se 
puede escribir 
(W—W<p«l1> = <pxV]O>, (17) 
donde 
W” = E' — Ha) (18) 


es la energía de la partícula dispersada perteneciente a un dispersor en el 
estado a”, que corresponde a la ley de conservación de la energía. El repre- 
sentante x del ket j0> es (6), y el del ket básico ¡p%a%> es 


<xa lpoa> — Bro <p> = Bara ho dgta yn, 


según se deduce de la función de transformación (54) de $ 23. Luego, 


10> = hiip“a0), (19) 
y así la ecuación (17) se puede escribir 
(W!—Wi<px11> = hi<poV ¡pla”>. (20) 


Ahora hagamos una transformación de coordenadas y pasemos de las 
componentes cartesianas Pa, Py y P» de p a sus componentes polares P, v y y 
dadas por 


Ps = P cos o, Pp, = P sen a cos y, p. = P sen o sen 7. 


Si en la nueva representación tomamos la función de peso P* sen «, enton- 
ces el peso asignado a cualquier volumen del espacio p será el mismo que 
en la representación p de antes y, en consecuencia, la transformación se 
reducirá a cambiar los símbolos de las filas y columnas de las matrices sin 
alterar en nada dichos elementos. Por tanto, en la nueva representación, 
(20) será 

(W—WiPoyx > = h<Poza ViPl0%yL00>, ' (21D) 


donde W ahora únicamente será función de P. 
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El coeficiente W' — W de <Puya']1> aquí es simplemente un factor 
multiplicativo y no un operador de derivación como ocurría en la repre- 
sentación x. Así pues, podemos dividir por él y obtener una expresión 
explícita de <Poya'[1>. Pero si a a” corresponde un W" definido por (18) 
mayor que mce?, dicho factor tendrá el valor cero en un cierto punto del 
dominio de la variable P, que será el punto P = P”, dado en función de W” 
por (16). Por tanto, la función <Pwya'11> tendrá una singularidad en dicho 
punto. Dicha singularidad nos indica que el número de partículas que se 
mueven a grandes distancias de los dispersores con energías infinitamente 
próximas a W” representado por <Puya'|1> es infinito y, por tanto, es pre- 
cisamente dicha singularidad lo que nos interesa para hallar la distribución 
angular de partículas en el infinito. | 

El resultado de dividir (21) por el factor W”— W, según (13) de 
$ 15, es 


“Paya 1> = h3<Poya [VIP%wy020>/(W*— W) + Moya) (W! — W), (22) 


donde A es una función arbitraria de o, y y Y. Para dar significado al 
primer término del segundo miembro de (22), haremos el convenio de que 
su integral respecto a P extendida a un dominio que contenga el valor P' 
es igual al límite cuando e >0 de la integral extendida a dicho dominio 
del que se ha suprimido el pequeño intervalo (P* — e, P” + e). Esto es sufi- 
ciente para precisar el significado de (22), pues únicamente nos interesan 
integrales de los representantes de los estados cuando la representación 
contiene un conjunto continuo de filas y columnas. Vemos que la ecua- 
ción (21) no es suficiente para determinar completamente el representante 
¿Puya'|1> debido a la función arbitraria A que aparece en (22). Hemos de 
elegir A de forma que <Poyv'11> represente únicamente partículas que se 
mueven hacia afuera, pues queremos que las únicas partículas incidentes 
correspondan al ket 10>. 

Consideremos en primer lugar el caso en que el representante <Pux[> 
de un estado de la partícula satisfaga una ecuación general del tipo 


(W —W)Poy)> = fíPox), (23) 


con una f(Poy) función arbitraria de P, + y y, y siendo W” un número 
mayor que mc”. <Poy|> será entonces de la forma 


<Poy)> = fPoy)(W'—W) + XMoy)(W' —W), (24) 


y determinamos A a fin de que <Pux!> represente únicamente partículas que 
se mueven hacia afuera. Podemos hacerlo expresando <Puyl> en la repre- 
sentación x o mejor a la representación (róg), y comparándolo con (12) para 
valores grandes de r. La función de transformación es 





<ropiPoy> aa h ie, x)/fi — hr3giPricos u cos 9 + sen Y sen 9 cos (x-6)1/1_ 


14. — CUÁNTICA 
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Para la dirección 6 = 0 resulta 
e 2n T 


ha | Pp? ap | dy | sen de e'P» cos “/A <Puy|]> 
0 0 


0 


| 


<r0g|> 


co 2T y 
etPr cos w/A u—xA 
-3 2 A 
h J P dp ] dy, ' -| iPr/h Pax» | u—0 + 


T 


4 eiPr cos v/A O P | 
+ [do pr a PO 

A 
Como puede verse integrando nuevamente por partes respecto a o, el 
segundo término dentro del paréntesis () es de orden r'* y, por tanto, 
puede ser despreciado. Llegamos pues a 


Do OT 


<rO0$l> = ih"Qrr)1 j P dP il dyfeiPr/M<Pry > — esPr/t<POx)>] 
0 0 


— ihr | P dPíe"'Pr/R<Pry > — etPr/2<POy >). (25) 
, | 


Si sustituimos <Pux|> por su valor (24), el primer término del integran- 
do de (25) da 


ir | Par 0 PAP) W —W) + MeyJa(W'— W)). — (26) 


El término que lleva consigo la 8¿(W' — W) se puede integrar inmediata- 
mente utilizando la relación P dP = WdW/c*? que es consecuencia de (16), 
y da 


o0 


ihrico2471 f W dW e-*P/% ys (W! — W) 
me ES hacer WNrye*Pr/ñ (97) 


Para integrar el otro término de (26) emplearemos la fórmula 


oo 


py e-iPr/ñ A peciPrin 
fp 0 = 0 [=p de, 2) 





0 0 
que es válida, despreciando los términos de orden r”?, para toda función 


00 


g(P) continua. En efecto, f K(P)je"*P"/* dP es de orden r?* para cualquier 


0 

función K(P) continua, y la diferencia | 
g(P)/(P" — P) — g(P")/(P" — P) 

es continua. El segundo miembro de (28) calculado despreciando los tér- 
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minos de orden r”* y dejando fuera del dominio de integración el pequeño 
intervalo (P' — e, P' + e), da 


> giPriñ Pei Pr-Prr Jn 


o0 





np" —Pr/h 
= ig(PrjePr/n j a rta IP = ing(PrjePr/A, (29) 


En nuestro caso, g(P) es o 
g(P) = ihariP (PROP! — P)/(W' —W). 


que para P = P” toma el valor límite 
g(P”) = ihirTP HP )W!/P'c? —= ihric?r1W(Pxx.. 


Sustituyendo esto en (29) y sumándole la expresión (27) obtenemos el si- 
guiente valor de la integral (26) 


hac TT WA— APO) + iMAYje Pt, (30) 
Análogamente, el segundo término del integrando de (25) vale 
hac 2r1W"[— TÍf(P'0) — iM0y)jeiP/ñ, (3D) 


La suma de estas dos expresiones es el valor de <r0g|> para r grande. 
<r0p|> debe representar únicamente partículas que se mueven hacia 
afuera, luego, ha de ser un múltiplo de e'P”/*, Por tanto, (30) ha de ser 


nulo, de donde 
Mr) = — inf(P'xy). (32) 


Resulta pues, que la condición de que <r0g|> represente únicamente par- 
tículas que vayan hacia afuera en la dirección 9 — O determina el valor 
de 4 en la dirección opuesta 9 — rm. Pero como la dirección 9 =0u vu =0 
del polo de las coordenadas polares no es privilegiada, podemos genera- 
lizar (32) y escribir 

Aloy) = —ixf(P'ox), (33) 


que nos da el valor de 4 en una dirección cualquiera. Dicho valor sustituido 
en (24) nos da un resultado que se puede escribir en la forma 


<Poy» = [Poy UA(W'—W) — iz SW" —W)), (34) 


pues en el coeficiente de un término que contiene ¿(W” — W) como factor 
se puede sustituir P” por P sin alterar su valor. Luego, la condición para 
que <Pux|> represente únicamente partículas que van hacia afuera es que 
contenga el factor 

¡1/(W! — W) — ir 3(W' — W)). (35) 
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Observemos que este factor es de la forma del segundo miembro de la 
ecuación (15) de $ 15. 

Teniendo en cuenta el valor de A dado por (33) la expresión (30) es nula, 
y en consecuencia, el valor de <r0f|> para r grande viene dado por (31), 
es decir, 


<r0p|> = — 2h 30 2r W(P'O0yger”*, 
Esto puede generalizarse y resulta 
<répl> = — 9h cr WiPloyerr!”, 


que da el valor de <róp|> para cualquier dirección 9, $ en función de 
f(P'oy) en esa misma dirección que designamos por 0, Y. Esta ecuación es 
de la forma (12) con 


u(09) = — 2h ic 2WI(Pox) 


y por tanto, representa una distribución de partículas de momento P' y de 
densidad 
| c?P' 4n?W'P' 
desa HP oy? 
due = EP (36) 





por unidad de ángulo sólido y de tiempo, que se mueven hacia afuera, que 
será la distribución representada por <Poy|> de (34). 

De esta conclusión general podemos inferir que, siempre que tengamos 
un representante <Pox/> que represente únicamente partículas que se mue- 
ven hacia afuera y que verifica una ecuación del tipo (23), el número de 
partículas por unidad de Angulo sólido y de tiempo viene dado por (36). 
Si dicho <Poy|> se refiere a un problema en el que el número de partículas 
incidentes por unidad de volumen es la unidad, corresponderá a un coe- 
ficiente de dispersión cuyo valor es 


4 Wow?'P* 


hcipo Poy): (37) 





Sólo depende del valor de la función f(P'oy) en el punto P = P”. 
Aplicando esta teoría general a las ecuaciones (21) y (22) tenemos 


f(Pory) —hi<Poya V|P oy). 


Luego, según (37), el coeficiente de dispersión es 


1 


Ar*h2WoW"P"/c%P0 . [<P ya ¡VIPWw00yLa2>]?. (38) 


Si despreciamos la relatividad y hacemos W0W'/ct — m?, este resultado 
se reduce a la expresión (15), obtenida en la sección anterior con ayuda 
del teorema de Green. 
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91. Dispersión con absorción y reemisión 


Vamos a hallar ahora el coeficiente de dispersión cuando la partícula 
puede ser absorbida, es decir, cuando el sistema no perturbado dispersor- 
partícula tiene estados estacionarios ligados en los cuales la partícula está 
absorbida. Veremos que la existencia de estos estados ligados del sistema 
no perturbado tiene un efecto considerable en la dispersión del sistema 
perturbado, efecto que depende mucho de la energía de la partícula inci- 
dente, y que da lugar en óptica al fenómeno de la “dispersión” * cuando la 
partícula incidente es un fotón. 

Utilizaremos una representación cuyos kets básicos correspondan a los 
estados estacionarios del sistema no perturbado, como en la representa- 
ción p de la sección anterior. Elegiremos como estados estacionarios del 
sistema no perturbado los estados (p'a”) en que la partícula tiene un mo- 
mento p' definido y el dispersor esté en un estado a” definido, y además los 
estados ligados k que constituyen un conjunto discreto separado, y supon- 
dremos que dichos estados son todos independientes y ortogonales entre sí. 
Esta hipótesis no es adecuada cuando la partícula es un electrón o un 
núcleo atómico, pues en ambos casos la partícula sigue teniendo alguna 
existencia en el estado de absorción k y, por tanto, es de esperar que po- 
dremos expresar |k> en función de autokets |x'a'> de x, y, 3 y de los a, y 
en consecuencia, también en función de los |p'a”>. En cambio, si las par- 
tículas incidentes son fotones, en los estados de absorción no tendrán exis- 
tencia alguna y, por tanto, dichos estados serán forzosamente independientes 
y ortogonales a los estados (p'x”) en que la partícula existe. Luego, la 
hipótesis es aplicable en este caso de gran interés práctico. 

Como se trata de un problema de dispersión, hemos de considerar esta- 
dos estacionarios del sistema total. Pero aquí tendremos que trabajar con 
la aproximación de segundo orden, pues la ecuación de primer orden (3) no 
es suficiente, y tendremos que emplear también la (4). La ecuación (3) 
escrita en función de los representantes de la representación elegida es 


(W"— W)<pv'11> = <px'V|O>, | 
(E — Ej)<k1> = <k|V/0>, j 
donde W” es la función de E' y de a dada por (18), y Es es la energía del 


estado estacionario k del sistema no perturbado. Análogamente, la ecua- 
ción (4) será 


(39) 


(W'— W)<pxa/2> = <px|Vil>, (40) 
(El —Ej)<k]2> = <k¡VIL>. 


J 


' N. de T.: Hemos traducido en todo el texto “scattering” por dispersión, pues no 
existe ningún término latino que corresponda exactamente al mismo concepto. En rea- 
lidad “dispersión” es un caso particular de “scattering”, y en el texto inglés se emplea 
exclusivamente en esta ocasión. 
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Desarrollando el segundo miembro mediante multiplicación de matrices 
resulta 


(W — W)<po12> 
= y [ova ep TD y AVR 
k 


at? 


4 

(El — Es)<k¡2> | (41) 
= E | «vr epi + 2 ¿KIVIK"><K"(D>. 

E” 


El ket [0> vendrá dado, como antes, por (19), de donde (39) se podrá 
escribir | 

(W'—W)pv11) = hi<pa Vipta?>, (42) 

(Er —EJ<kD> = HkiVIp?o>. (43) 


Podemos suponer que los elementos de matriz <K'[VIk”> de V son nulos, 
puesto que dichos elementos no son esenciales para el fenómeno que esta- 
mos investigando, y de no ser nulos no significaría más que que no habria- 
mos elegido adecuadamente los estados de absorción k. Supondremos ade- 
más que si se consideran los elementos de matriz <K Vip”, <p a 1V|k”> 
de primer orden de magnitud, los elementos <p'a(Vip"a”> son de segundo 
orden. Esta hipótesis la justificaremos en el caso de fotones en $ 64. Con 
ello, según (43) y (42), resulta <kl1> de primer orden siempre que E' no 
tenga un valor próximo a alguno de los niveles de energía discretos Ex, y 
en cambio <pq|1> será de segundo orden. Por tanto, según la primera 
ecuación (41), <po12> en segunda aproximación será 


(W—Wipa 2 = My <parivIR<k"Vipa">/(E"— Ex) 
k” 


Luego, la corrección total hasta el segundo orden de la función de onda, es 
decir <px'|1> más <px2>, verificará | 


(W' —W)í<p011)> + <pa2>) 
— <p iVipooo> +3 <paVIko<kiVipra”>/(E"— E.)). 
k 


Esta ecuación es del tipo (23) si a” es tal que W > me*, lo que es equiva- 
lente a exigir que el estado final a” sea compatible con la ley de conser- 
vación de la energía. Luego, según el resultado general (37), podemos 
deducir que el coeficiente de dispersión es 
4r2h2WoW*P* (pra VIk><kiVIpoao> [7 
, O 0 , 
c4po <p 7 1V|p > + 2 OEI : 2200 OS E . (44) 





En este caso la dispersión puede considerarse compuesta por dos partes, 
una que proviene del elemento de matriz <p'a/1Vip%a%> de la energía de 
perturbación, y otra que se deriva de los elementos de matriz <p/aIVik> y 
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<klVip?x%>. La primera parte, que es igual al valor obtenido previamente 
en (38) podemos llamarla dispersión directa. La segunda puede considerar- 
se producida por una absorción de la partícula incidente pasando el sis- 
tema a un estado k seguida inmediatamente de una reemisión en una 
dirección distinta, fenómeno análogo a las transiciones a través de estados 
intermedios considerados en $ 44. El hecho de que hayamos tenido que 
sumar los dos términos antes de tomar el cuadrado del módulo nos dice 
que hay interferencia entre los dos tipos de dispersión. No existe ningún 
procedimiento experimental para separar las dos clases de dispersión, y la 
distinción entre ambas es de índole puramente matemática. 


52. Dispersión de resonancia 


Supongamos ahora que variamos continuamente la energía de la par- 
tícula incidente dejando fijo el estado inicial del dispersor «%, y así la ener- 
gía total E” o H' variará continuamente. La fórmula (44) nos dice que 
cuando E” se aproxima mucho a uno de los niveles de energía discretos Ex, 
la dispersión se hace muy grande. De hecho, según la fórmula (44), la 
dispersión debiera ser infinita cuando E” fuera exactamente igual a un E. 
Por supuesto, un coeficiente de dispersión infinito es imposible desde el 
punto de vista físico, lo que nos induce a pensar que la aproximación em- 
pleada en la deducción de (44) deja de ser válida cuando E” está próximo 
a algún E,. Para estudiar la dispersión en este caso hemos de recurrir a la 
ecuación exacta (2) de $ 43 con E” en lugar de P”, 


(E — EH = V|H”>, 


y emplear un método distinto para aproximar la solución. Esta ecuación 
exacta escrita como (41) en forma de representantes es 


(W — W)pa'H'> 

> | pr Vip"2> dp” <p"aH) + y <pe/VIK"><k"1H0, 
(El —EJCHE 

= Y f <kVip"2%> dep” <p "a IE) + Y <KIVIRO<K IB. 


(45) 


Tomemos un E, particular y consideremos el caso en que E” sea pró- 
ximo a él. El término grande del coeficiente de dispersión (44) proviene de 
los elementos de matriz de V de la fila k o de la columna k, es decir, de los 
elementos del tipo <k|Vipa”> o <pa"[Vik>. La dispersión debida a los otros 
elementos de matriz de V es de un orden de magnitud inferior. Ello nos 
sugiere que la aproximación que debemos hacer en la ecuación exacta (45) 
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es despreciar todos los elementos de matriz de V salvo los importantes, es 
decir, salvo los del tipo <pa/¡VIk> o <kiVipa>, donde «' es un estado final 
del dispersor cuya energía no supera el valor máximo compatible con la 
ley de conservación de la energía. En dicha aproximación, las ecuaciones 
se reducen a 


(W—W)<pa 1H") = <p VIk><k|¡H0>, 
(46) 
Er —EJXKHO = Y | <KVipa”> d'p <po1H>, 


en donde la sumación respecto de a” se refiere a aquellos valores de a” para 
los cuales W” dado por (18) es mayor que mc?. Estas ecuaciones son Su- 
ficientemente sencillas para poder ser resueltas exactamente sin tener que 
hacer nuevas aproximaciones. 

A partir de la primera ecuación (46), por división obtenemos 


<p H'> = <pa'¡VIk> <kH>/(W'— W) +A s(w' — W). (47) 


Hemos de elegir 2» — que puede ser una función cualquiera de los mo- 
mentos p y de a — de modo que (47) represente las partículas incidentes 
correspondientes a ¡0> o hiipla%> y partículas que vayan, todas hacia afuera. 
[El representante de hilpla*> ahora es de la forma 1 3(W' — W), ya que 
las condiciones Y =«% y p =p” para que no sed nulo nos llevan a 
w —= E —Háa) = E —Hdo) = wo — W.] Luego, (47) ha de ser 


<pa H'> = hi<pa/ poa) Y- 
+ <pa¡Vik> «HL W'— W) — ír ¿(w*— wW), (48) 


y según la fórmula general (37), el coeficiente de dispersión será 
42W%W'P"/hc*Po .| <p [VIk> [Fl <k¡H'> Y. (49) 


Nos queda por calcular él valor de <k¡H'>. Para ello podemos sustituir 
<pa/1¡H'> en la segunda ecuación (46) por su valor (48). Así resulta 


(Er — E¡<k¡H”> — hickiVipa0> + 


4x0 Y | 1<RVIRa> PU/W— W) — 53 W)) dsp 


— hi<k|Vipta”> + <k¡H'>(a — ib), 
donde 


a= E | 1<KVipz> P drp/w—W) (50) 
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y 
b=% YE f |[<kVipo> Ps W—W) dp 
== 08) | <k|ViPoya> PP 8(W! — W)P? dP sen vo dody 
= 3. Y PW0” | | [<«ViP 072) Esen o dody, (51) 
Luego, 
<KH> = hikVipra?>/(E! — E, —a + ib). (52) 


Observemos que a y b son reales, y que b es positivo. 
Este valor de <k|H'”> sustituido en (49) nos da un coeficiente de dis- 
persión 





— CET 





4h WoW'P" [<p Vik [| <kiVip0a0> |? (53) 


Para hallar la sección eficaz sobre la que debe incidir la partícula para ser 
dispersada de cualquier forma, integramos (53) para todas las direcciones 
de dispersión, es decir, para todas las direcciones del vector p” cuyo módu- 
lo P” es fijo, y luego sumamos para todos los a” que hemos de tener en con- 
sideración, o sea, aquellos para los que W” > mc?. Con ayuda de (51), estos 
cálculos nos dan el resultado 

Arh2W0 b| <ki¡Vip%a”> | 


PEE és 


Si ahora variamos E” continuamente pasando por el valor Ej, la 
principal variación de (53) o (54) será debida al pequeño denominador 
(E —E,—a)?? + b?. Si despreciamos la dependencia de E” a través 
de los otros factores que figuran en (53) y (54), la máxima dispersión se 
obtendrá cuando E' tenga el valor E, + a, y cuando E difiera de dicho 
valor en la cantidad b, la dispersión será la mitad de su valor máximo. 
La gran dispersión que aparece para valores de la energía de la partícula 
para los que E' es próximo a E, da lugar al fenómeno de que aparezca una 
línea de absorción. El centro de dicha línea estará desplazado de la 
energía de resonancia de la partícula — o sea aquella energía que haría 
que la energía total fuera exactamente igual a E, —en una cantidad a, 
en tanto que la cantidad b representa la llamada semiamplitud de la línea. 
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53. Emisión y absorción 


Para el estudio de la emisión y absorción hemos de considerar estados 
no estacionarios y emplear el método de perturbaciones de $ 44. Si quere- 
mos calcular el coeficiente de emisión espontánea hemos de tomar un 
estado inicial en el que la partícula esté absorbida, que corresponderá, por 
tanto, a un ket |k>, y determinar la probabilidad de que en un instante 
posterior la partícula escape hacia infinito con un momento definido. 
Podemos aplicar el método de $ 46. Según el resultado (39) de dicha sec- 
ción, la probabilidad por unidad de tiempo y por unidad de intervalo 
de w y de y, de que la partícula sea emitida en cualquier dirección w”, Y 
quedando el dispersor en el estado « es 


2h] Wa VIL> Y, (55) 


siempre que a” sea tal que la energía W” de la partícula dada por (18) sea 
mayor que mc”. Para valores de que no satisfagan dicha condición no 
hay emisión posible. Los elementos de matriz <W'w'y/VIk> deben refe- 
rirse a una representación en la que W, o, y y a sean diagonales con la 
función de peso unidad. En cambio, los elementos de matriz de V que apa- 
recen en las tres secciones anteriores se refieren a una representación en la 
que Pz, Pv» Pz SON diagonales con la función de peso unidad, o en la que 
P, «, y son diagonales con la función de peso P* sen o. Se refieren, por 
tanto, a una representación en la que W, o, y son diagonales con una 
función de peso dP/dW - P2 sen y = WP/c?.sen «w. Luego, el elemento 
de matriz <W'w'y/4(VIk> de (55) es igual a (W"P"/c? sen v”) multiplicado 

or el elemento de matriz de las secciones anteriores <W'w'y/A[VIK> o 
<p'[Vik>; de donde (55) es igual a 


%r W*P' 


ze sen u] <p ¡VIk> [. 





Luego, la probabilidad de emisión por unidad de ángulo sólido y por uni- 
dad de tiempo de modo que el dispersor pase simultáneamente al estado a 
será 


2 WP+,,),,> 
4 [<p [VIk> E. (56) 





Para hallar la probabilidad total por unidad de tiempo de que la 
partícula sea emitida en una dirección cualquiera dejando al dispersor en 
un estado final cualquiera, habremos de integrar (56) para todos los ángulos 
' y y”, y Sumar después para todos los estados a” cuya. energía Ha(a”) veri- 
fique la condición Ha(a') + me? < Es. El resultado da 2b/H, donde b es la 
cantidad definida en (51). Por tanto, existe esta sencilla relación entre el 
coeficiente de emisión total y la semiamplitud de la línea de absorción. 
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Consideremos ahora la absorción. Habremos de tomar un estado inicial 
para el cual la partícula no esté absorbida sino que incida con un momento 
definido. Luego, el ket que corresponde al estado inicial en este caso será 
de la forma (19). Debemos determinar la probabilidad de que la partícula 
sea absorbida después de un tiempo t. Dado que nuestro estado final k no 
pertenece a un intervalo de estados continuo, no podemos emplear direc- 
tamente el resultado (39) de $ 46. Pero si tomamos como ket correspon- 
diente al estado inicial 

10> = [pao>, (57) 


sigue siendo aplicable el análisis de 88 44 y 46 hasta la ecuación (36), y 
nos dice que la probabilidad de que la partícula sea absorbida para formar 
el estado k después de un tiempo t es 


2] <k|Vip"a0> P?[1 — cos ((E, — Et /Ry]/(E, — E')?. 


Este valor corresponde a una distribución de partículas de densidad A”, 
debido a la omisión del factor hi en (57) comparada con (19). Luego, la 
probabilidad de que la partícula sea absorbida tras un tiempo t cuando 
el número de partículas incidentes que atraviesan la unidad de área en la 
unidad de tiempo es la unidad vale 


2h W0/c?P0 . | <k|Vip%a0> P[1 — cost(E, — E)t/K)1/(E, — EP. (58) 


Para obtener el coeficiente de absorción hemos de considerar par- 
tículas incidentes que no tengan todas exactamente el mismo valor de la 
energía W0% — E'— H,(a%), sino con una distribución de los valores de 
la energía en torno al valor correcto E, — Ha(a%) requerido para que haya 
absorción. Si tomamos un haz de partículas incidentes que contenga una 
partícula por unidad de intervalo de energía y por unidad de tiempo que 
atraviesa la unidad de área, la probabilidad de que haya una absorción 
tras un tiempo t vendrá dada por la integral de 58 respecto a E”. Dicha 
integral puede ser calculada del mismo modo que (37) de $ 46, y es igual a 


Ar2h2W%/c2P0 . | <k|V|p%a0> [?. 


Luego, la probabilidad de absorción por unidad de tiempo para un haz 
incidente que contenga una partícula por unidad de intervalo de energía 
que atraviesa la unidad de área por unidad de tiempo será 


4rR2h2W0/c?P0 . | <k[VIpoo> [-, (59) 


que es el coeficiente de absorción. 

Veamos cuál es la relación entre los coeficientes de absorción y de 
emisión (59) y (56), y los coeficientes de dispersión de resonancia calculados 
en la sección anterior. Cuando el haz incidente no está constituido por 
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partículas con la misma energía, sino por una distribución que contenga 
una partícula por unidad de intervalo de energía y de tiempo que atraviesa 
la unidad de área, el número total de partículas con energías próximas a 
una línea de absorción que serán dispersadas vendrá dado por la integral 
de (54) respecto a E”. Si despreciamos la dependencia del numerador de (54) 
respecto a E”, dicha integral tendrá precisamente el valor (59), puesto que 


/ AA dE” = T, 

J) (E — E, —a)? + b? 

Luego, el número total de partículas dispersadas en el entorno de una línea 
de absorción es igual al número total de partículas absorbidas. Por lo 
tanto, podemos considerar que dichas partículas dispersadas han sido 
absorbidas y después reemitidas en otra dirección. Además, el número de 
partículas dispersadas por unidad de ángulo sólido en una dirección, dada 
por p', que pertenecen a dispersores en el estado a' en el entorno de una 
línea de absorción viene dado por la integral de (53) respecto a E”, que 
calculada como antes tiene el valor 


2hL2W0W*'p? 
HA EL wVIO Pavia 
Este valor es precisamente igual al coeficiente de absorción (39) multipli- 
cado por el coeficiente de emisión (56) y dividido por el coeficiente de emi- 
sión total 2b/A. Esto concuerda con el punto de vista que considera las 
partículas dispersadas por resonancia como aquellas partículas que han 
sido absorbidas y después reemitidas, teniendo lugar ambos procesos de 
absorción y emisión cada uno con su propia ley probabilística indepen- 
diente del otro, ya que según dicho punto de vista, la fracción del número 
total de particulas absorbidas que sería reemitida en una dirección dada 
por unidad de ángulo sólido, sería precisamente igual al coeficiente de 
emisión en dicha dirección dividido por el coeficiente de emisión total. 








IX 


SISTEMAS QUE CONTIENEN PARTÍCULAS IDÉNTICAS 


54. Estados simétricos y antisimétricos 


En física atómica si un sistema contiene varias partículas de la misma 
clase — por ejemplo, un conjunto de electrones —, dichas partículas son 
aber utente distinga ales enito sí. Al intercambiar dos de ellas no se 
produce ningún cambio observable. Esta circunstancia da lugar a fenómenos 
curiosos en mecánica cuántica, sin análogo en la teoría clásica, que derivan 
del hecho de que en mecánica cuántica pueden tener lugar transiciones en 
las que se intercambian dos partículas idénticas, y que no pueden ser detec- 
tadas por ningún procedimiento de observación. Evidentemente una teoría 
aceptable debería considerar que dos estados indistinguibles en toda obser- 
vación son el mismo estado y que el intercambio de dos partículas idén- 
ticas no constituye ninguna transición. Más adelante veremos que es 
posible volver a formular la teoría de forma que verifique estas condi- 
ciones. 

Sea un sistema que contiene n partículas idénticas. Como variables 
dinámicas podemos tomar un conjunto de variables €, para la primera 
partícula, el conjunto correspondiente E2 para la gunda y así sucesiva- 
mente hasta la n-ésima. Con esta elección las E, conmutarán con las E, 
para 1>s. (Puede ocurrir que sean necesarias otras variables extra para 
dar cuenta de otros componentes del sistema además de las n partículas, 
pero no será necesario mencionarlas explícitamente en este capítulo.) El 
hamiltoniano que describe el ez EY del sistema se podrá expresar 
como función de las E, Es, .. El hecho de que las partículas sean 
idénticas exige que el ¡Pon sea una función simétrica de Es, 82, 

., En, es decir, que permanezca invariante cuando se intercambian o per- 
mutan de cualquier forma los conjuntos de variables £,. Esta condición 
debe ser válida para cualquier perturbación aplicada al sistema. De hecho, 
cualquier cantidad que tenga significado físico debe ser una función si- 
métrica de las É,. 

Sean [a,>, |b,>, ..., kets de la primera partícula considerada ella sola 
como un sistema dinámico. Existirán kets correspondientes [az>, |ba>, 
para la segunda partícula y así sucesivamente. Podemos construir un ket 


á P == 


222 SISTEMAS QUE CONTIENEN PARTÍCULAS IDÉNTICAS 


para el conjunto mediante el producto de kets, cada uno de los cuales 

corresponde a una partícula considerada ella sola como un sistema; por 

ejemplo, O 
lay>Ib2>|03>...En> a lasb2Cz...2n> i E (1) 


según la notación (65) de $ 20. El ket (1) corresponde a un tipo de estado 
particular del conjunto, que se caracteriza porque en él cada partícula está 
en sú propio estado, simbolizado por el factor correspondiente que figura en 
el primer miembro de-(1). El ket general del conjunto será una suma 0 
integral de kets del tipo (1), y corresponde a un estado para el cual no_se 
puede afirmar que cada partícula esté en su propio estado, sino únicamente 
que cada partícula está parcialméñte en los distintos estados de forma re- 
lacionada con el modo cómo las otras partículas están parcialmente en Tos 
diversos estados. Si as», |b,>, ..., es un conjunto de kets básicos para la 
primera partícula consideráda sola, los kets laz», |b2>, ... constituirán a su 
vez un conjunto de kets básicos para la segunda partícula considerada ella 
sola y así sucesivamente; y en ese caso los kets (1) constituirán un conjunto 
de kets básicos para el conjunto. Diremos que la representación del con- 
junto formada por estos kets básicos es una representación simétrica, pues 
trata del mismo modo a todas las partículas. AS j 

En (1) podemos intercambiar los kets de las dos primeras partículas y 
obtener un nuevo ket del conjunto | 


bipla2>les?....g> = [brarcs... gn). 


De forma más general podemos intercambiar el papel de las dos primeras 
partículas de cada ket del conjunto y obtener nuevos kets del conjunto. 
El proceso de intercambiar las dos primeras partículas equivale a la aplica- 
- ción de un operador a los kets del conjunto, que como los estudiados en 


A as A ¿IR a 


$ 7, será también lineal. Análogamente, el proceso de intercambiar cual- 
quier par de partículas corresponde a un operador lineal, y por aplicación 
sucesiva de tales intercambios podemos obtener cualquier permutación 
de las partículas; por tanto, una permutación aparece ahora como la 
aplicación de un nuevo operador lineal a los kets del conjunto. Una per- 
mutación se dice que es par o impar según que sea necesario un número 
par o impar de intercambios para formarla. 

Diremos que un ket |X> del conjunto es simétrico si es invariante al 
aplicarle cualquier permutación, es decir si 7 


a tt 


¡o =1 7] (2) 





para cualquier permutación P. Y diremos que es antisimétrico si no cambia 
al aplicarle una permutación par y cambia de signo al aplicarle una per 
mutación impar, es decir, si 

PIX> = =IX>, (3) 


y oh Ca, PG Me E LAA 


A A o , 
AN ÓN o”) 
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donde los signos + o — dependen de si P es par o impar. Los estados 
correspondientes a kets simétricos se denominan estados simétricos y los 
que corresponden a kets antisimétricos, estados antisimétricos*/En una 
representación simétrica el representante de un ket simétrico será una 
función simétrica de las variables de las distintas partículas, y el repre- 
sentante de un ket antisimétrico será una función antisimétrica. 

En la la imagen de de Schródinger el ket que corresponde a un estado del 
conjunto variará con el tiempo od egún la ode mall vimiento de Schró- 
dinger. aaa da Ea era un ket simétrico deberá permanecer siempre 
simétrico, pues, teniendo en cuenta que el hamiltoniano es simétrico, no hay 
ningún elemento que pueda destruir o cambiar la simetría. Análogamente 
si el ket era inicialmente antisimétrico deberá permanecer siempre antisi- 
métrico. . Luego, todo estado que inicialmente es simétrico seguirá siéndolo” 


siempre, y todo estado que inicialmente 2 es antisimétrico conservará igual- 
mente su antisimetría] En « consecuencia, puede ocurrir que para una deter- 
minada clase de parti no se den en la naturaleza más que estados 
simétricos o antisimétricos. Si ocurriese alguna de estas dos posibilidades, 
daría lugar a ciertos fenómenos especiales para las partículas en cuestión. 

Supongamos en primer lugar que únicamente se presenten en la natu- 
raleza estados antisimétricos. El ket (1) no es antisimétrico y, por tanto, no 
corresponde a ningún estado real. A partir de (1) podemos construir siempre 
un ket antisimétrico aplicándole todas las posibles permutaciones y su- 
mando los resultados, después de multiplicar los términos que provienen 


de una And impar por — 1. Así obtenemos 


> de Pla,b,cCz.. -En>> (4) 
P 





en donde el signo + o — depende de si P es par o impar. El ket (4) se 
puede escribir en forma de determinante 


las> laz» jas . . . las 
Ibi> lb2> lb3> . . .  |bn> 
lc» lea» les» . . .  |Cn> 
(5) 
le> lg» lgs» . . . lg8m> 


y su representante en una representación simétrica será un determinante. 
El ket (4) o (5) no es el ket antisimétrico general sino únicamente un simple 
ket particular. Corresponde a un estado del conjunto en el que están ocu- 
pados ciertos estados-partícula, a saber, los estados a, b, Cc, ..., g, no pu- 
diendo decirse qué partícula está en cada estado, pues cualquier partícula 
tiene la misma probabilidad de ocupar cualquiera de dichos estados. Si dos 


) 
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de los estados-partícula a, b, c, ..., g son el mismo, el ket (4) o (5) es nulo 
y no corresponde a ningún estado del conjunto. Luego, dos partículas no 
pueden ocupar el mismo estado. Más en general, los estados ocupados han 
de ser todos independientes, pues sino (4) o (5) son nulos. Ésta es una 
característica importante de las partículas que sólo pueden ocupar esta- 
dos antisimétricos. Ello da lugar a una estadística especial, que fue estu- 
diada por vez primera por Fermi, y así llamaremos fermiones a las particu- 
las que sólo pueden ocupar estados antisimétricos. 

Supongamos ahora que únicamente se presenten estados simétricos. 
El ket (1) no es simétrico a menos que todos los estados-partícula a, b, C, 
.... g sean el mismo estado, pero siempre será posible construir a partir de 
él un estado simétrico aplicándole todas las permutaciones posibles y su- 
mando los resultados; así se obtiene 


> PlasbzC3...2n> - (6) 
P 


El ket (6) no es el ket simétrico general, sino un ket particular sencillo. 
Corresponde a un estado del conjunto para el que están ocupados ciertos 


estados-partícula, a saber, los estados a, b, c, ..., g, no pudiendo decirse 
qué partícula está en cada estado. En este caso es posible que dos o más 
estados a, b, c, ..., g sean el mismo estado. Como consecuencia de ello, la 


estadística a que obedecerán las partículas no será la misma que la que se 
utiliza corrientemente en la teoría clásica. Esta nueva estadística fue estu- 
diada por primera vez por Bose, y así llamaremos bosones a las partículas 
que sólo pueden ocupar estados simétricos. 

Podemos poner de manifiesto la diferencia entre la estadística de Bose 
y la estadística ordinaria considerando el caso particular en que no haya 
más que dos partículas y dos estados independientes a y b para una de 
ellas. Según la mecánica clásica, si el conjunto de las dos partículas está 
en equilibrio termodinámico a temperatura elevada, cada partícula tendrá 
la misma probabilidad de estar en cualquiera de los dos estados. Por tanto, 
habrá una probabilidad 4 de que ambas partículas estén en el estado a, 
una probabilidad 4 de que ambas estén en el estado b, y una probabili- 
dad 3 de que una partícula esté en un estado y la otra en el otro. En la 
teoría cuántica existen tres estados simétricos independientes para el par 
de partículas, que corresponden a los kets simétricos |a,>las>, lb,>lb2>, y 
la>Jb2> + la»>|b1>, y que representan respectivamente los estados en que 
ambas partículas están en el estado a, ambas en el estado b y una partícula 
en un estado y la otra en el otro. En equilibrio termodinámico a tempera- 
tura elevada, los tres estados serán igualmente probables como se vio en 
$ 33, y, en consecuencia, existirá una probabilidad 3 de que ambas par- 
tículas estén en el estado a, una probabilidad 3 de que ambas estén en el 
estado b, y una probabilidad 3 de que una partícula esté en un estado y 
la otra en el otro. Luego, en la estadística de Bose la probabilidad de que 
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dos partículas estén en el mismo estado es mayor que en la estadística 
clásica. La estadística de Bose difiere de la estadística clásica en sentido 
contrario al que difiere la de Fermi, para la cual la probabilidad de que dos 
partículas ocupen el mismo estado es nula. 

Al establecer una teoría de los átomos siguiendo el camino indicado 
al comienzo de $ 38, es necesario, a fin de explicar los resultados experi- 
mentales, suponer que dos electrones nunca pueden estar en el mismo 
estado. Esta regla se conoce con el nombre de principio de exclusión de 
Pauli. Esto nos demuestra que los electrones son fermiones. La ley de Planck 
de la radiación nos dice que los fotones son bosones, pues únicamente la 
estadística de Bose conduce a dicha ley. Análogamente, existen razones 
experimentales para todas las demás partículas conocidas en física que 
indican que son fermiones o bosones. Los protones, neutrones y positrones 
son fermiones, mientras que las partículas a son bosones. Todas las par- 
tículas que se dan en la naturaleza son o bien fermiones o bien bosones, y, 
en consecuencia, los únicos estados que se presentan en la práctica para 
un conjunto de partículas idénticas son o simétricos o antisimétricos. 
Matemáticamente son posibles otras clases de simetría más complicada, 
pero no se presentan para ninguna de las partículas conocidas. En una 
teoría en la que una misma partícula admite únicamente estados simétri- 
cos O antisimétricos, no hay ninguna distinción entre dos estados que sólo 
difieren en la ordenación de las partículas, y así las transiciones menciona- 
das al comenzar esta sección dejan de existir. 


99. Las permutaciones como variables dinámicas 


Vamos a construir una teoría general aplicable a los sistemas que con- 
tienen n partículas idénticas cuyos "estados pueden presentar cualquier clase 
de simetría, es decir, sin imponer ninguna restricción de que sólo puedan 
darse estados simétricos o sólo estados antisimétricos. El estado general 
no será simétrico ni antisimétrico, y para n > 2, ni siquiera se podrá ex- 
presar linealmente en función de estados simétricos y antisimétricos. Esta 
teoría no se puede aplicar directamente a ninguna clase de partículas exis- 
tente, no obstante, será útil para obtener un método aproximado de tratar 
un conjunto de electrones como veremos en $ 58. 

Hemos visto que cualquier permutación P de las n partículas es un 
operador lineal que puede ser aplicado a cualquier ket del conjunto. 
Luego, P puede ser considerada como una variable dinámica de nuestro 
sistema de n partículas. Existen n! permutaciones, y cada una de ellas 
puede considerarse como una variable dinámica. Entre ellas está la per- 
mutación idéntica P, que es igual a la unidad. El producto de dos permu- 
taciones cualesquiera es otra permutación, y por tanto, cualquier función 
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de permutaciones puede reducirse a una función lineal. Toda permuta- 
ción P tiene su inversa P”* que verifica 


EE ZIP E PL 


La permutación P se puede aplicar al bra <X| del conjunto, obtenién- 
dose un nuevo bra, que de momento designaremos por P<X|. Si aplica- 
mos P a ambos factores del producto <X|Y>, éste debe quedar inalterado 
por ser dicho producto un número que no depende del orden de las par- 
tículas. Luego, 

(P<XPPIY> = <XIY> 
de donde 
PX ==> <X(P= (7) 


Pero P<X| es el conjugado imaginario de P|X> y, por tanto, es igual a <X|P, 
luego, según (7) se tiene 
PR pa, (8) 


En consecuencia, las permutaciones no son en general variables dinámicas 
reales, siendo el complejo conjugado de una permutación igual a su re- 
cíproco. 


Cualquier permutación de los números 1, 2 ,3, ..., n se puede expresar 
como producto de ciclos; por ejemplo para n = 8 se tiene 
P. = (143)(27)(58)(6), (9) 


donde dentro de cada paréntesis todo número debe ser reemplazado por el 
siguiente menos el último que debe ser sustituido por el primero. Así pues, 
P, cambia los números 12345678 por 47138625. La clase de permutación 
queda determinada por la partición del número n dada por la cantidad 
de números que hay en cada paréntesis. Así la clase de P, viene dada por 
la partición 8 = 34-2+2+ 1. Diremos que las permutaciones de la 
misma clase, es decir, correspondientes a la misma partición son permuta- 
ciones equivalentes. Así por ejemplo, P, de (9) es equivalente a 


P, = (871(35)/40(2). (10) 


El conjunto de las n! permutaciones posibles puede dividirse en conjuntos 
de permutaciones equivalentes, y cada uno de dichos conjuntos se deno- 
mina una clase de equivalencia. La permutación P, = 1 constituye por 
si sola una clase. Toda permutación es equivalente a su recíproca. 

Cuando dos permutaciones P, y P, son equivalentes, cualquiera de ellas, 
por ejemplo P,, se puede obtener mediante una permutación P, de la 
otra P,. Así, para las permutaciones (9) y (10) podemos tomar como P, la 
permutación que cambia 14327586 por 87135462, es decir, la permutación 


P, = (18623)(475). 
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Los distintos modos de escribir P, y P, en notación cíclica darían lugar a 
distintas P¿. Cualquiera de dichas P, aplicada al producto Pa|X> daría como 
resultado P, . P.[X>, es decir, 


PPAX> == PiPolA>: 
Luego, 

E 00 SE (11) 
que expresa la condición para que P, y P, sean equivalentes en forma de 
ecuación algebraica. La existencia de un P, cualquiera que verifique (11) 
es suficiente para asegurar que P, y P, son equivalentes. 


56. Las permutaciones como constantes del movimiento 


Toda función simétrica V de las variables dinámicas de todas las particu- 
las queda inalterada cuando se le aplica una permutación cualquiera P, 
y por tanto, al aplicar P al producto V¡X> queda aplicada al factor IX>, 
o sea, 


PV¡X> VPI|X>. 
Luego, 


PV — VP, (12) 


que nos viene a decir que toda función simétrica de las variables dinámicas 
conmuta con las permutaciones. El hamiltoniano es una función simétrica 
de las variables dinámicas, y por tanto conmuta con cualquier permutación. 
Luego, toda permutación es una constante del movimiento. Este resultado 
es válido incluso cuando el hamiltoniano no es constante. Si |Xt> es una 
solución cualquiera de la ecuación de movimiento de Schródinger, PIXt> 
es también solución. 

En mecánica cuántica, cuando estudiamos un sistema y encontramos 
una constante del movimiento a, sabemos que si en un estado de movi- 
miento cualquiera tenía inicialmente el valor numérico a”, seguirá tenien- 
do siempre dicho valor, pudiendo así asignar distintos valores numéricos al 
a los distintos estados y de este modo clasificarlos. Pero cuando tenemos 
distintas constantes del movimiento « que no conmutan entre sí (como 
ocurre con las permutaciones P), el procedimiento no es tan directo, pues, 
en general, no podemos asignar valores numéricos simultáneamente a todas 
las « en ningún estado. Consideremos en primer lugar el caso de un sistema 
cuyo hamiltoniano no es función explícita del tiempo. La existencia de 
constantes del movimiento « que no conmutan entre sí indica que el sis- 
tema es degenerado. En efecto, para un sistema no degenerado, el hamilto- 
niano H constituye por sí solo un conjunto completo de observables que 
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conmutan, y en consecuencia, según el teorema 2 de $ 19, cualquier «a es 
función de H, y así H conmuta con cualquier a. 

Hemos de buscar una función f£ de las « que para todos los estados 
que pertenezcan a un mismo nivel de energía H”, tenga el mismo valor 
numérico f”, pudiendo de esta forma utilizar £ para clasificar los niveles 
de energía del sistema. La condición que ha de verificar 8 es la de ser una 
función de H y, por tanto, ha de conmutar con toda variable dinámica que 
conmute con H, es decir, con toda constante del movimiento. Si las a son 
las únicas constantes del movimiento, o bien si existe un conjunto de « que 
conmuta con todas las demás constantes del movimiento independientes, 
nuestro problema se reduce a hallar una función 8 de las « que conmute 
con todas las a. Con ello podremos asignar a 8 un valor numérico 8” para 
cada nivel de energía del sistema. Si existen distintas funciones 8, han de 
conmutar unas con otras a fin de que podamos asignar simultáneamente a 
todas ellas valores numéricos. Obtenemos así una clasificación de los nive- 
les de energía. Cuando el hamiltoniano es función explícita del tiempo, no 
podemos hablar de niveles de energía, pero las £ seguirán siendo una cla- 
sificación útil de los niveles de energía. 

Vamos a seguir este procedimiento para estudiar las permutacio- 
nes P, Hemos de hallar una función yx de las P tal que PyP"* = y para 
toda P. Evidentemente una y posible será >; P., la suma de todas las per- 
mutaciones de una clase c, es decir, la suma del conjunto de todas las 
permutaciones equivalentes, ya que Y PP¿P”1* estará formado por las mis- 
mas permutaciones sumadas en un orden distinto. Existirá una de estas y 
para cada clase. Además, no puede existir ninguna otra y independiente, 
pues toda función de las P puede expresarse como función lineal de ellas 
con coeficientes numéricos, y no conmutarán con todas las P a menos que 
los coeficientes de las P equivalentes sean idénticos. Así obtenemos todas las 
y que sirven para clasificar los estados. Es conveniente definir cada y como 
una media y no como una suma, y así 


Xo — 1 y Es 
siendo n, el número de P que hay en cada clase c. Otra forma de escri- 
bir Y. es 
E O 4 (13) 
Pp 


donde la suma está extendida a todas las n! permutaciones P, siendo fácil 
ver que dicha suma contiene cada elemento de la clase c el mismo número 
de veces. Para cada permutación P existe una y, que podemos llamar y(P), 
igual a la media de todas las permutaciones equivalentes a P. Una de las y 
es A(P 1) =L, 

Las constantes del movimiento Yi, Y2, .-., Xm asi obtenidas tendrán un 
valor numérico definido para cada estado estacionario del sistema cuando 
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el hamiltoniano no sea función explícita del tiempo, y en el caso general 
pueden servir asimismo para clasificar los estados, pues existirá un con- 
junto de estados para cada conjunto de valores permitidos Y, X%, --- a 
de las x. Dado que las y son constantes del movimiento en todos los casos, 
dichos conjuntos de estados serán exclusivos, es decir, que nunca tendrán 
lugar transiciones desde un estado de un conjunto a un estado de otro 
conjunto. 

Los conjuntos de valores posibles de y” que se pueden asignar a las y 
están limitados por el hecho de que existen relaciones algebraicas entre 
las y. El producto de dos y cualesquiera xp Xq Se puede expresar lineal- 
mente en función de las P, y puesto que conmuta con todas las P tiene que 
poderse expresar como función lineal de las y; tendremos pues 


Lo La = UM Y1 <a 2 4... + Um Xm> (14) 


donde las a, son números. Cualesquiera valores numéricos y” que se asignen 
a las y han de ser autovalores suyos y han de satisfacer estas mismas ecua- 
ciones algebraicas. Para cada solución y” de estas ecuaciones existe un con- 
junto exclusivo de estados. Una solución evidente es y, = 1 para toda y), 
que corresponde al conjunto de estados simétricos. Otra solución también 
obvia, que da lugar al conjunto de estados antisimétricos es y, = +1, con 
signo más o signo menos según sean pares o impares las permutaciones 
de la clase p. Las demás soluciones pueden ser halladas en cualquier caso 
particular con los métodos algebraicos ordinarios, pues los coeficientes a, 
de (14) pueden obtenerse directamente considerando los tipos de permu- 
tación a que hacen referencia las y que intervienen. Cada solución es, salvo 
un factor numérico, lo que en teoría de grupos se denomina un carácter 
del grupo de las permutaciones. Las y son todas variables dinámicas 
reales, puesto que cada P y su compleja conjugada P”* son equivalentes 
y en la definición de las y entrarán, en consecuencia, sumadas; por tanto 
las y' han de ser números reales. 

El número de soluciones posibles de las ecuaciones (14) puede ser calcu- 
lado fácilmente, pues tiene que ser igual al número de autovalores distintos 
de una función arbitraria B de las y. Con ayuda de las ecuaciones (14) 
podremos expresar B linealmente en función de las y; y así 


B = by X1 +b» X2 SN meo AN Bin Xm- (15) 


Análogamente podemos expresar cada una de las cantidades B?, B3, ... Br 
como función lineal de las y. De las m ecuaciones así obtenidas y la ecua- 
ción x(P,) = 1 podemos eliminar las m incógnitas y1, Yo, ..., Ym Obteniendo 
como resultado una ecuación algebraica de grado m en B, 


Br+c BA CcB2 4. +6 =0, 
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Las m soluciones de esta ecuación determinan los m autovalores posibles 
de B, cada uno de los cuales será una función lineal de las b,, bz, ..., Bm 
según (15), cuyos coeficientes serán un conjunto de posibles valores y”, X,, 
.-»> Y. Los conjuntos de valores y/ así obtenidos han de ser todos distintos, 
pues si hubiera menos de m conjuntos de valores y” de las y distintos, exis- 
tiría una función lineal de las y cuyos autovalores serían todos nulos, lo 
que implicaría que la propia función fuese idénticamente nula, y las y 
no serían linealmente independientes. Luego, el número de conjuntos de 
valores numéricos de las y es exactamente igual a m, o sea, igual al número 
de clases de permutaciones que a su vez es igual al número de particiones 
de n. En consecuencia, el número de conjuntos exclusivos de estados es 
igual a dicho número. 

Todas las variables dinámicas que tienen importancia física y todas las 
cantidades observables son simétricas respecto a las partículas, y por tanto, 
conmutan con todas las P. Luego, las únicas funciones de las P que tienen 
importancia física son las y. Los estados que corresponden a |y'> y a 
K(PNy >, donde |y'> es un autoket de las y perteneciente a los autovalo- 
res y” y f(P) es una función cualquiera de las P tal que f(P)ix"> 740, son 
indistinguibles para toda observación y, por tanto, son equivalentes desde 
el punto de vista físico. Multiplicando |yx'> por funciones de las P podre- 
mos formar un número determinado n(y') de kets independientes, que de- 
penderá únicamente de las y/. Dicho número será igual al número de filas 
o columnas de una representación matricial de las P en la que cada y sea 
igual a y'. Si |y'> corresponde a un estado estacionario, n(x”) será un grado 
de degeneración (en lo que concierne a la degeneración producida por la 
simetría entre las partículas). Esta degeneración no puede ser eliminada 
por ninguna perturbación simétrica respecto a las partículas. 


57. Determinación de los niveles de energía 


Apliquemos el método de perturbaciones de $ 43 para calcular en pri- 
mera aproximación los niveles de energía, en el caso de que el hamiltoniano 
no sea función explícita del tiempo. Supondremos que para los estados 
estacionarios del conjunto del sistema no perturbado, cada una de las 
partículas idénticas está en su propio estado. Para n partículas tendremos 


n estados que corresponderán a los kets ja'>, [a”>, ..., |a">, que de mo- 
mento supondremos ortogonales. El ket del conjunto será en este caso 

X> = jatolaz>...Jam>, (16) 
igual que (1) pero con a”, af,..., en lugar de a, b, ... Aplicándole una per- 


mutación P obtenemos otro ket 


PIX) = lat»la2>...laz> (17 
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donde r, s, ..., z es una permutación de los números 1, 2, ..., n, que co- 
rresponderá a otro estado estacionario del conjunto con la misma energía. 
En conjunto habrá pues, n! estados no perturbados con dicha energía, si 
suponemos que no hay ninguna otra causa de degeneración. Según el méto- 
do de $ 43, cuando el sistema no perturbado es degenerado hemos de 
considerar los elementos de matriz de la energía de perturbación V que 
hacen referencia a dos estados con la misma energía, es decir, los estados 
del tipo <X|P¿VP,|X>. Dichos elementos formarán una matriz de n! filas 
y columnas, cuyos autovalores serán las correcciones de primer orden de 
los niveles de energía. 

Hemos de definir otro tipo de operadores de permutación aplicable a 
los kets de la forma (17), que actúan sobre los índices de las «. Los ope- 
radores de permutación de este tipo los designaremos por P*. La diferencia 
esencial entre los operadores P y los P* puede ponerse de manifiesto del 
modo siguiente. Consideremos en general la permutación que cambia 2 
por 3, Puede interpretarse bien como el intercambio de los objetos 2 y 3, 
o bien como el intercambio de los objetos que ocupan los lugares 2 y 3, sien- 
do distinto el resultado en ambos casos. La primera de estas interpreta- 
ciones es la que corresponde a los operadores P, siendo los objetos en 
cuestión las partículas idénticas. Las permutaciones P pueden aplicarse a 
cualquier ket del conjunto. En cambio, la segunda interpretación de las 
permutaciones sólo tiene sentido cuando se aplica a kets de la forma (17), 
para los cuales cada partícula está en un lugar dado por a, o bien, cuando 
se aplica a una suma de dichos kets. Las permutaciones P pueden consi- 
derarse como variables dinámicas ordinarias, mientras que las permutacio- 
nes P* sólo pueden considerarse como variables dinámicas en un sentido 
restringido, aplicable únicamente cuando se consideran estados que se 
pueden obtener por superposición de los distintos estados (17), que es lo 
que ocurre en nuestro problema de perturbación. 

Podemos formar funciones algebraicas de las P* que serán nuevos ope- 
radores aplicables a kets de la forma (17). En particular podemos cons- 
truir y(Pz), o sea, la media de todos los P* de una cierta clase. Dicha fun- 
ción ha de ser igual a y(P.), — promedio de los operadores de permuta- 
ción P de la misma clase — pues el conjunto de todas las permutaciones 
de una clase tiene que ser a todas luces el mismo, tanto si las permuta- 
ciones se aplican a las partículas como si se aplican a los lugares que 
ocupan dichas partículas. Toda P conmuta con toda P*, es decir, 


PP: = Pop, (18) 


Designando las a con los mismos números 1, 2, 3, ..., n que empleamos 
para designar las partículas, podemos establecer una correspondencia bi- 
yectiva entre las a y las partículas, y dada una permutación P, cualquiera 
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aplicada a las partículas, dar significado a la misma permutación P* aplica- 
da a las a. Dicho significado es tal que para el ket |X> dado por (16) 


P=P [X> = |X). (19) 


Puesto que los kets jah), >, ..., Son ortogonales, ¡X> y P|X> serán tam- 
bién ortogonales, salvo para P = 1. Luego, para cualesquiera coeficientes 
Cp se verifica 





S cp<X¡P“P¿X> = Cr, (20) 
P 


donde ¡X> ha de estar normalizado, y la sumación se extiende a todas las 
n! permutaciones P o P* dejando P, fija. Definamos ahora V» por 


Vp = <XIVPIX>. (21) 
Con ello resulta, para dos permutaciones P, y P, cualesquiera, 


<X|P¿VP, X> ==> <XIVP,P, X> == Ver, 
— Y Vp<X/P“P.P, IX) 
P 


con ayuda de (20). Mediante (18) se obtiene 
<XIP,VP,X> = Y Vp<XIP¿P*P,1X>. (22) 
P 


Este resultado se puede escribir en la forma 
Vz y VpP*, (23) 
P 


donde el signo = significa que la ecuación es válida en sentido restrin- 
gido, es decir, que los operadores que figuran en ambos miembros son 
iguales mientras se utilicen con kets de la forma P|X> y sus bras imaginarios 
conjugados. 

La fórmula (23) nos dice que la energía de perturbación V es igual, en 
sentido restringido, a una función lineal de los operadores de permutación 
P*“ de coeficientes V» dados por (21). Este sentido restringido es adecuado 
para calcular las correcciones de primer orden de los niveles de energía, 
pues dicho cálculo sólo lleva consigo elementos de matriz de V dados 
por (22). La fórmula (23) es muy útil dada la facilidad con que se opera 
con su segundo miembro. 

Como ejemplo de aplicación de (23) vamos a determinar el valor 
medio de la energía para todos los estados que, perteneciendo a un con- 
junto exclusivo, provienen del estado no perturbado (16). Para ello hemos 
de calcular el valor medio de V para los estados (17) en que las y tienen 
valores numéricos determinados y/. Pero el valor medio de P* en cualquiera 
de dichos estados es igual al de P*P*(P*)2, donde P* es arbitrario, y por 
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tanto vale nl”? 2 PPP)? o sea y(P:) o (Pa). Luego, el valor me- 
dio de V es 2 Voy (P) . Podemos emplear un método análogo para calcular 


el valor medio de cualquier función de V, para lo cual únicamente hemos 
de sustituir cada P“ por y'(P) en el cálculo del promedio. 

El número de niveles de energía que hay en un conjunto exclusivo 
% = Y que provienen de un estado dado del sistema no perturbado es 
igual al número de autovalores del segundo miembro de (23) que son 
compatibles con las ecuaciones y = y/. Dicho número no es más que el 
número n(x”) introducido al final de la sección precedente, y es igual al 
grado de degeneración de los estados de dicho conjunto. 

Hemos supuesto que los kets individuales la*>, Ja?>, ..., que determinan 
los estados no perturbados mediante (16) son ortogonales. La teoría 
puede generalizarse fácilmente para el caso en que algunos de ellos estén 
repetidos, y los que son distintos sigan siendo ortogonales. En este caso 
tenemos algunas permutaciones P* para las que P*[X> = [X>, que serán 
todas aquellas que consistan únicamente en intercambios de las a iguales. 
La ecuación (20) seguirá siendo válida si extendemos la suma únicamente a 
aquellas P que dan distintos valores de P*|X>. Con este cambio en el 
significado de >, siguen siendo válidas todas las ecuaciones anteriores, 


P 
incluso el resultado (23). Para el ¡X> de ahora existirán limitaciones sobre 
los posibles valores numéricos de las y y así, por ejemplo, no pueden 
tomar los valores que corresponden a un |X> antisimétrico. 


58. Aplicación a electrones 


Consideremos el caso de que las partículas idénticas sean electrones. 
Según el principio de exclusión de Pauli discutido en $ 54, únicamente 
habremos de considerar estados antisimétricos. Es necesario considerar 
explícitamente el hecho de que los electrones tienen spin, que se mani- 
fiesta por la aparición de un momento angular y un momento magnético. 
El efecto del spin en el movimiento de un electrón bajo la acción de un 
campo electromagnético no es muy grande. Sobre el electrón actúan unas 
fuerzas adicionales debidas a su momento magnético, que introducen 
nuevos términos en el hamiltoniano. El momento angular de spin no tiene 
ninguna acción directa sobre el movimiento, pero entra en juego cuando 
existen fuerzas que tienden a hacer girar su momento magnético, pues el 
momento magnético y el momento angular han de tener siempre la 
misma dirección. En ausencia de un campo magnético fuerte dichos efec- 
tos son pequeños, del mismo orden que las correcciones introducidas por 
la mecánica relativista, y no sería útil considerar dichos efectos en una 
teoría no relativista. La importancia del spin no reside en estos pequeños 
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efectos sobre el movimiento del electrón sino en el hecho de que propor- 
ciona dos estados internos del electrón, en correspondencia con los dos 
valores posibles de la componente del spin en una dirección cualquiera, y 
que hace que el número de estados independientes de un electrón sea 
doble. Este hecho, combinado con el principio de exclusión de Pauli, tiene 
consecuencias muy importantes. 

Para un conjunto de electrones tenemos dos clases de variables dinámi- 
cas. Las primeras son las coordenadas x, y, z de todos los electrones y sus 
momentos canónicos conjugados Pz, Py, P2 que denominaremos variables 
orbitales. Las segundas son las variables de spin 5s, y, SÍ de todos los 
electrones, introducidas en $ 37. Ambas clases de variables pertenecen a 
grados de libertad distintos. Según $$ 20 y 21, existen kets que determinan 
el estado del sistema total de la forma |A>|B>, siendo |A> un ket que hace 
referencia únicamente a las variables orbitales y |B> un ket que únicamente 
hace referencia a variables de spin, y el ket general que determina el 
estado del sistema total será una suma o integral de kets de este tipo. 
Este modo de considerar el problema nos permite introducir dos clases de 
operadores de permutación, los P que actúan sobre las variables orbitales 
y que únicamente se aplican al factor |A> y los P” que actúan sobre las 
variables de spin y se aplican únicamente al factor |B>. Los P* y los P* 
podrán aplicarse a cualquier ket del sistema total, y no únicamente a cier- 
tos kets particulares como ocurría con los P* de la sección anterior. Las 
permutaciones P se aplicaban a todas las variables dinámicas de las partícu- 
las en cuestión, y por tanto para los electrones actuarán tanto sobre las 
variables orbitales como sobre las variables de spin. Así pues, cada P, será 
igual al producto 

Po PE o (24) 

Veamos ahora la necesidad de tener en cuenta las variables de spin al 
aplicar el principio de exclusión de Pauli, aunque despreciemos las fuerzas 
de spin en el hamiltoniano. P, ha de tener el valor +1 en todo estado 
existente, según sea una permutación par o impar; luego, según (24) 


pp == 
ara (25) 


La teoría de las tres secciones precedentes resultaría trivial si se aplica- 
se directamente a los electrones, para los cuales cada P, = +1. En cam- 
bio, podemos aplicarla a las permutaciones P? de los electrones. Si despre- 
ciamos los términos del hamiltoniano que provienen de las fuerzas de spin, 
las P? son constantes del movimiento, ya que, en tal caso, las variables 
dinámicas de spin a no figuran para nada en el hamiltoniano. Luego, las P* 
también han de ser constantes del movimiento. Podemos, pues, introducir 
unas nuevas y iguales a la media de todas las P* de cada clase, y afirmar 


A 


| 
| 
| 
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que para cada conjunto permitido de valores numéricos yx” de dichas y, 
existe un conjunto exclusivo de estados. Luego, existen conjuntos exclu- 
sivos de estados para los sistemas que contienen muchos electrones, pese 
a que nos limitemos a considerar únicamente estados que satisfacen el 
principio de exclusión de Pauli. Evidentemente, los conjuntos exclusivos 
de estados, lo serán ahora, únicamente de forma aproximada, pues las y 
solamente son constantes del movimiento cuando despreciamos las fuerzas 
de spin. En este caso existirá una pequeña probabilidad de que tenga lugar 
una transición desde un estado de un conjunto a un estado de otro 
conjunto. 

La ecuación (25) relaciona de un modo sencillo las P* y las P”, y nos 
permite obtener todos los resultados que deseemos, como, por ejemplo, los 
caracteres y/, estudiando las variables dinámicas P” en lugar de las P*. 
Las P” son mucho más fáciles de estudiar debido a que no existen más que 
dos estados de spin independientes para cada electrón. Este hecho se 
traduce en que haya menos caracteres yx” para el grupo de permutaciones 
de las variables y que para el grupo general de las permutaciones, pues 
impide que un ket de las variables de spin sea antisimétrico respecto a más 
de dos de ellas. 

El estudio de las P” es particularmente sencillo debido a que se pueden 
expresar como funciones algebraicas de las variables dinámicas a. Consi- 
deremos la cantidad 


Ojs = 3(1 + Ug1 0924 Syl Ty2 + Uz1 de = 341 + (a, G»));. 
Con ayuda de las ecuaciones (530) y (51) de $ 37 obtenemos fácilmente 


(81,02)? = (551 022 + Sy1 Oya 02102) = 3—2(0,, 02), (26) 
y en consecuencia, 
O, = 141 + 26,, 02) + (6,1, 02)?) = 1. (27) 
Además resulta 
Ora 071 = 31051 + 0g9 — 1071 Sy2 + Uy 22), 
072 Oj = 51072 + 0 + 101 0:22 — 1021 0y2) 
luego, 
Or 01 = Og2 Ojo. 


Para 0,1 y 0.1 son válidas relaciones análogas 


Oj201 = 020; 
O sea, 
Os 981 OD — OU». 


De aquí, con ayuda de (27) podemos obtener 


O¡202011 = 6. 
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Estas relaciones de conmutación entre O,z y 6, y 92 son precisamente las 
mismas que las de Pz, permutación que intercambia las variables de spin 
de los electrones 1 y 2. Luego, podemos poner 


at Do 
Oj2 = CP, 


siendo c un número. La ecuación (27) demuestra que c = =+l. Para ver 
cuál de los dos valores de c es el adecuado, observemos que los auto- 
valores de Pf son 1, 1, 1, — 1, correspondientes respectivamente a los 
tres estados simétricos independientes y al estado antisimétrico de las 
variables de spin de dos electrones, que en la notación de $ 37 están 
representados por las tres funciones simétricas falo” Y, (o ¿li falo” o” )f,(o (o), 
falo” felo”.) + falo” Jalo”,), y la función antisimétrica jalesJolo )= 
— fala Male”. .). Luego, la media de los autovalores de P;, es 3. Pero la 
media de los autovalores de (9,, Gs) es evidentemente igual a cero, y por 
tanto, la media de los autovalores de Ojz es 3. Luego, hemos de tomar 
= +1, y resulta entonces 


Pio = 111 + (6,, 6»))!. (28) 


De esta forma toda permutación P” que consista en un simple inter- 
cambio puede expresarse como función algebraica de las a. Toda permu- 
tación P” puede expresarse como producto de intercambios, y en conse- 
cuencia también se podrá expresar como función algebraica de las a. Con 
ayuda de (25) podemos expresar las P” como funciones algebraicas de las e 
y eliminar las P” de la discusión. Como para los intercambios hemos de 
tomar el signo menos en (25), dado que el cuadrado de un intercambio 
es igual a uno, tenemos 


Pt = —31l + (0,1, 02). (29) 


La fórmula (29) es apta para calcular los caracteres y” que definen los 
conjuntos exclusivos de estados. Por ejemplo, para las permutaciones que 
consisten simplemente en un intercambio, tenemos 


19 =— Pt, — E S | 
0 y ) == e" 2 (00%) 


r<t 


Si introducimos la variable dinámica s para describir la magnitud del 
momento angular de spin total + 22 go, en unidades de %f, según la fórmula 


CS (1 y 0,43 os) 








, 
j 
¡ 
3 
l 
? 
y 
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que está de acuerdo con (39) de $ 36, tenemos 


2 y (6,, 9;) al 2 O,, 2 a 2 (8,, 0,) 


r<t 


= Ás(s + 1) — 3n. 
Luego, 
Zi 4s(s+ 1)—3n]) —  n(n—A4)-+ 4s(s + 1) 
12 = — 3 po aa —=D Tf = Ta =D (30) 


Por tanto, y1. se puede expresar como función de las variables dinámi- 
cas s y del número de electrones n. Cualquiera de los demás y puede 
calcularse de forma análoga y dicho cálculo nos llevaría a expresarlo 
como función únicamente de s y de n, pues no hay ninguna otra función 
simétrica de todas las variables dinámicas 4 que pueda intervenir. Por tanto, 
existe un conjunto de valores y” de las y, y en consecuencia, un conjunto 
exclusivo de estados, para cada autovalor Y de s. Los autovalores de s son 

3n, 3¿n—1l, 3n—2  ..., 
terminando la serie con 0 o ¿. 

Así vemos que cada estado estacionario de un sistema de varios elec- 
trones es un autoestado de s— magnitud del momento angular de spin 
total 3 S a, expresado en unidades de fi — perteneciente a un autovalor 


determinado s'. Dado un $ cualquiera existirán 2s” + 1 valores posibles de 
una componente del vector spin total en una dirección cualquiera que 
corresponderán a 25” + 1 estados estacionarios con la misma energía. Si no 
despreciamos las fuerzas debidas a los momentos magnéticos de spin, 
los 25” + 1 estados se desdoblarán en general en 2s' + 1 estados con ener- 
glas ligeramente diferentes, dando lugar a un multiplete de multiplicidad 
2s' + 1. Si despreciamos las fuerzas de spin, no pueden ocurrir transi- 
ciones en las que s” cambie, es decir, transiciones de una multiplicidad 
a Otra, y si no las despreciamos sólo existirá una pequeña probabilidad 
de que tengan lugar. 

Podemos calcular en primera aproximación los niveles de energía de un 
sistema de varios electrones aplicando la teoría de la sección anterior con 
kets [a"> que hagan referencia únicamente a las variables orbitales, y 
empleando la fórmula (23). Si únicamente consideramos las fuerzas de 
Coulomb entre los electrones, la energía de interacción V estará cons- 
tituida por una suma de términos cada uno de los cuales hace referencia 
únicamente a dos electrones, de donde los elementos de matriz de V» serán 
todos nulos a excepción de los que se refieran a una P” unidad o a una P” 
que consista en un simple intercambio de dos electrones. Luego, (23) se 


reducirá a 
V = V, A+ y Vr. Eos (31) 


r<g 
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siendo V,, el elemento de matriz que se refiere al intercambio de los 
electrones r y s. Como las P* tienen las mismas propiedades que las P*, 
cualquier función de las P* tendrá los mismos autovalores que la función 
de las P correspondiente y, en consecuencia, el segundo miembro de (31) 
tendrá los mismos autovalores que 


Vi+ y Vi, P* 


ISS 


V, NS 2 y Vesíl + (a,, Gs); (32) 


r<8 


según (29). Los autovalores (32) darán las correcciones de primer orden 
de los niveles de energía. La expresión (32) nos muestra que un modelo 
que suponga la existencia de una energía de acoplamiento entre los spines 
de los electrones que están en los estados orbitales r y s, de valor 
—3V,,(0,, 0,) resultaría sin duda muy acertada. Esta energía de acopla- 
miento es mucho mayor que la de los momentos magnéticos de spin. 
Estos modelos atómicos se emplearon antes de conocerse la justificación 
que de ellos da la mecánica cuántica. 

Podemos tener dos estados orbitales iguales del sistema no perturbado, 
es decir, que los kets ja"> referentes a las variables orbitales de dos elec- 
trones pueden ser iguales. Supongamos que jal> y la?> sean iguales. 
Entonces únicamente hemos de tomar los autovalores de (31) compatibles 
con Pi = 1, o sea, aquellos autovalores de (32) compatibles con Kf¿ = 10 
Pp” — —1. Según (28) dicha condición da (a,, 62) = —3, de donde 
(a, + 62)? = 0. Luego, la resultante de los dos spines 6, y 42 es nula, que 
puede interpretarse diciendo que los spines 4, y dG: son antiparalelos. Por 
tanto, podemos decir que dos electrones que estén en el mismo estado 
orbital tienen sus spines antiparalelos. No pueden haber más de dos electro- 
nes en el mismo estado orbital. 
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59. Conjuntos de bosones 


Consideremos un sistema dinámico constituido por u” particulas idén- 
ticas. Formemos una representación para una cualquiera de las partículas 
constituida por los kets básicos discretos JaD>, ja2>, (a), .... A partir 
de ellos podemos obtener una representación simétrica del conjunto de u' 
partículas, como vimos en $ 54, tomando como kets básicos los pro- 
ductos 


Jazs>[a?>las>...la2, Ss lagadas...a2, (1) 
en los cuales hay un factor por cada partícula; los subíndices 1, 2, 3, ..., u” 
de las a son los símbolos de las partículas, y los superíndices a, b, c, ..., 8 


representan los índices (P, (2, (3), ... de los kets básicos de las partículas. 
Si se trata de bosones, para los cuales sólo existen estados simétricos, 
debemos considerar únicamente los kets simétricos que pueden construirse 
a partir de los kets (1). Los estados correspondientes a dichos kets simé- 
tricos formarán un conjunto completo de estados para el conjunto de 
bosones. Podemos construir para ellos la siguiente teoría. 

Introducimos el operador lineal S definido por 


$ = aun s P, (2) 


donde la suma está extendida a todas las 4! permutaciones de las u' par- 
tículas. Al aplicar S a cualquier ket del conjunto se obtiene un ket simétrico. 
Por consiguiente, podemos llamar a S operador de simetrización. Según (8) 
de $ 55, dicho operador es real. Aplicado al ket (1) da 


41? 5 Pg a as...02,> = Sjatada”...a0> (3) 


En el segundo miembro se omiten los símbolos de las partículas puesto 
que ya no son significativos. El ket (3) representa un estado del con- 
junto de u” bosones definido por una distribución de los mismos entre los 
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diversos estados bosónicos, en la que ningún bosón particular está aso- 
ciado a ningún estado particular. La distribución queda determinada 
cuando sabemos cuantos bosones hay en cada estado bosónico, Sean 


ni. ns, na, ... los números de bosones que están respectivamente en los 
estados a, 40, a(3, .... Los n están definidos algebraicamente por la 
ecuación 

ye q» El e + q — nas +nas + n, a(3) eS pio (4) 


La suma de las 1”, cs evidentemente 1. Elnúmero de n”, es igual al número 
de kets básicos ja'"”>, que en la mayoría de aplicaciones de la teoría es 
mucho mayor que u”, y así pues la mayor parte de las n/ son nulas. Si 
a%, 2%, a, ..., es son todos diferentes, es decir, si las n/ son todas 0 o 1 el 
ket (3) está normalizado, puesto que en este caso los términos del primer 
miembro de (3) son ortogonales entre sí y cada uno contribuye con u'!”1 
al cuadrado de la longitud del ket. En cambio, si a*, a?, a, .... a2 no son 
todos diferentes, los términos del primer miembro de (3) que provienen de 
permutaciones P, que sólo intercambian bosones en el mismo estado, serán 
iguales. El número de términos iguales será n/!n/!n/! ..., y, por lo tanto, 
el cuadrado de la longitud del ket (3) será 


? 
as ... 


<aratas...ariSilatada”... >) =p ta ln... (5) 


Para estudiar el estado general del conjunto podemos introducir los 
números n;, 2, nz ... de bosones que están respectivamente en los estados 
ad, a, 43, ... y considerar las n; como variables dinámicas o como 
observables. Sus autovalores son 0, 1, 2, ..., w. El ket (3) es un autoket 
común a todas las n; pertenecientes a los autovalores ni, nin, .... Los 
diversos kets (3) constituyen un conjunto completo para el sistema dinámico 
formado por u” bosones, y en consecuencia, las n; conmutan entre sí (ver 
el recíproco del teorema de $ 13). Además, sólo hay un ket (3) indepen- 
diente que pertenezca a cualquier conjunto de autovalores nn, n/,, +» + Por 
lo tanto, las n; forman un conjunto completo de observables que conmu- 
tan. Si normalizamos los kets (3) y simbolizamos los kets resultantes me- 
diante los autovalores de las n; a que pertenecen, es decir, si ponemos 


CALAS !...)ISlatada”... 0) = | ¡AAA (6) 


obtenemos un conjunto de kets [nn5n'...>, en los cuales todos los mí 
toman valores enteros no negativos cuya suma vale uv”, y que constituyen 
los kets básicos de una representación con las n, diagonales. 

Las n; pueden expresarse como funciones de los observables a, az q, 
..., Ay, definidos por los kets básicos de los bosones individuales, mediante 
la ecuación 

m=YE bo 00, Y 


r 
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o las ecuaciones 


2 mflo”) = 2 Ho.) (8) 


válidas para cualquier función f. 

Supongamos ahora que el número de bosones del conjunto no esté 
fijado, sino que sea variable. Este número es, por consiguiente, una va- 
riable dinámica u observable u, con autovalores 0, 1, 2, ..., y el ket (3) es 
un autoket de u perteneciente al autovalor 4”. A fin de obtener un con- 
junto completo de kets para nuestro sistema dinámico deberemos tomar 
ahora todos los kets simétricos (3) para todos los valores de u”. Podemos 
ordenarlos del modo siguiente. 


IP. aos. Slatao,. Sata), vs (9) 


escribiendo en primer lugar el ket sin símbolo, que corresponde al estado 
en que no hay bosones, a continuación vienen los kets correspondientes a 
los estados con un bosón, después los correspondientes a estados con dos 
bosones, etc. Un estado general corresponde a un ket que es combina- 
ción lineal de los distintos kets (9). Los kets (9) son ortogonales entre sí, 
pues dos kets que representan estados con el mismo número de bosones 
son ortogonales como antes vimos, y dos kets que representan estados con 
distinto número de bosones son ortogonales por ser autokets de u perte- 
tenientes a autovalores distintos. Normalizando todos los kets (9), obte- 
nemos un conjunto de kets análogo a (6) pero para el cual no hay restric- 
ción en las n; (es decir, cada n/ puede tomar todos los valores enteros no 
negativos), y dichos kets forman los kets básicos de una representación 
del sistema dinámico constituido por un número variable de bosones con 
las n; diagonales. 

Si no hay interacción entre los bosones y si los kets básicos la», 
222), ... representan estados estacionarios de un bosón, los kets (9) re- 
presentarán estados estacionarios de un conjunto de bosones. El número 
de bosones es constante con el tiempo, pero no ha de ser necesariamente 
un número particular, es decir, el estado general es una superposición de 
estados con diversos valores de u. Si la energía de un bosón es H(a), la 
energía del conjunto será, según (8), 


E Ha) = E mr (10) 


designando con H* el número H(a*). Esta expresión nos da el hamiltoniano 
del conjunto como función de las variables dinámicas n,. 


16. — CUÁNTICA 
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60. Relación entre bosones y osciladores 


En $ 34 estudiábamos el oscilador armónico, sistema dinámico con un 
grado de libertad, que se puede describir mediante uma q y p canónicas, 
y cuyo hamiltoniano es igual a la suma de cuadrados de q y p previa- 
mente multiplicados por coeficientes numéricos. Definimos matemática- 
mente un oscilador general como un sistema con un grado de libertad 
que puede describirse mediante una q y p canónicas, y cuyo hamilto- 
niano sea una serie de potencias en q y p, y que continúe siéndolo aunque 
el sistema sea perturbado arbitrariamente. Vamos a estudiar ahora un 
sistema dinámico compuesto por un conjunto de estos osciladores. Para 
describir cada oscilador podemos emplear en vez de q y p una variable 
dinámica compleja 7, correspondiente a la y de $ 34, y su compleja con- 
jugada, que satisfagan la relación de conmutación (7) de $ 34. Asignare- 


mos los símbolos 1, 2, 3, ... a los diferentes osciladores, de modo que el 
conjunto completo de osciladores pueda describirse mediante las variables 
dinámicas %1, M2, M3, .-., Ti, Ne, Ma, ---» que satisfacen las relaciones de 
conmutación 
Na No — No Ma = O, 
Na To — To Ta = O, | (11) 
Te Y — To Na = 0av- / 
Pongamos 
Maa ==: Ra (12) 
de modo que 
Te a = Ma + 1. (13) 


Las n son observables que conmutan entre sí y el desarrollo de $ 34 mues- 
tra que cada una de ellas tiene como autovalores todos los enteros no 
negativos. Para cada oscilador a hay un ket standard de la representación 
de Fock |0,>, que es un autoket normalizado de n, perteneciente al auto- 
valor cero. Multiplicando entre sí todos estos kets standards obtenemos 
un ket standard de la representación de Fock del conjunto de osciladores 


[0,> |02> [03> ..., (14) 


el cual es un autoket común a todas las n pertenecientes a los autovalores 
cero. Lo designaremos simplemente |0>. Según (13) de $ 34 


Tal0> ="0 (15) 


para cualquier a. Los desarrollos de $8 34 muestran también que si 
n, n, n, ... son enteros no negativos cualesquiera, 


aña Tas T]3> -.. ]0> (16) 
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es un autoket común a todas las n, perteneciente a los autovalores 
ni, ni, ni... Los diversos kets (16) obtenidos tomando distintas n, forman 
un conjunto completo de kets ortogonales entre sí, siendo el cuadrado de 
la longitud de uno de ellos, según (16) de $ 34, n/!ní tm! .... Podemos 
ver pues, teniendo en cuenta el resultado (5), que los kets (16) tienen 
exactamente las mismas propiedades que los kets (9), y así igualamos cada 
ket (16) al ket (9) que hace referencia a los mismos valores ní sin introdu- 
cir ninguna contradicción. Esto supone tomar 


Slatada”...a2> — Na Mo Te --. MalO>. (17) 


El ket standard |0> resulta igual al primero de los kets (9), correspondien- 
tes a la ausencia de bosones. 

La consecuencia de la ecuación (17) es la identificación de los estados 
de un conjunto de bosones con los estados de un conjunto de osciladores. 
Esto significa que el sistema dinámico constituido por un conjui.to de 
bosones idénticos es equivalente a un conjunto de osciladores — los dos 
sistemas son exactamente el mismo sistema visto desde dos puntos de vista 
distintos. Hay un oscilador asociado con cada estado bosónico indepen- 
diente. Éste es uno de los resultados más importantes de la mecánica 
cuántica, que permite realizar una unificación de las teorías ondulatoria 
y corpuscular de la luz. 

La teoría de la sección anterior se construyó sobre un conjunto discreto 
de kets básicos |a“> para un bosón. Podríamos pasar a un conjunto dis- 
creto diferente de kets básicos |8%>, y construir sobre ellos una teoría 
análoga. Los kets básicos para el conjunto serían, en vez de (9) 


>, 18%,  Sla“gB), SIB*BPBO>, .... (18) 


El primero de los kets (18), que representa el estado en que no hay bosones, 
es el mismo que el primer ket de (9). Los kets (18), que representan es- 
tados con un bosón, son funciones lineales de los kets (9) que represen- 
tan estados con un bosón, es decir 


18%) = Y Jar><or[B9), (19) 


y en general los kets (18) referentes a la presencia de u' bosones son fun- 
ciones lineales de los kets (9) referentes a la presencia de u” bosones. Así 
pues existirá un nuevo conjunto de variables de osciladores Y, asociadas 
a los nuevos estados básicos |8*> de un bosón, y en correspondencia con 
(17) tendremos 

Si848B8“ ...> = 1aNsNo...10>. (20) 


Luego un ket 91Nz...[0> con ul factores Na, Ma, ... ha de ser función 
lineal de los kets 7,7»...[0> con u” factores Na, Mo .... Por consiguiente, 
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cada operador lineal 7, ha de ser función lineal de las 7. La ecua- 
ción (19) da 
nal0> = Y, nal0><ar 18 


y de aquí 
na = Y MA]Bo). (21) 


Luego, las y se transforman según la misma ley que los kets básicos de un 
bosón. Las 1 transformadas satisfacen las mismas relaciones de conmu- 
tación con sus complejas conjugadas que las originales. Las % transfor- 
madas están en pie de igualdad con las originales, y por consiguiente, 
cuando consideramos nuestro sistema dinámico como un conjunto de osci- 
ladores, los diferentes grados de libertad no tienen un significado in- 
variante. | 

Las 7 se transforman según la misma ley que los bras básicos de un 
bosón, y por lo tanto, según la misma ley que los números <a*|x> que for- 
man el representante de un estado x. Esta similitud da lugar a que a 
menudo se diga que las % vienen dadas por un proceso de segunda cuanti- 
ficación aplicado a <a“jx>, significando con ello que, tras haber construido 
una teoría cuántica para una sola partícula e introducido los números 
<a“ix> que representan un estado de la partícula, pueden introducirse 
operadores lineales correspondientes que satisfacen las relaciones de con- 
mutación correctas (11) con sus compleos conjugados, obteniéndose así 
la base matemática apropiada para tratar un conjunto de dichas partículas, 
siempre que se trate de bosones. Para fermiones hay un proceso Corres- 
pondiente, que estudiaremos en $ 65. 

Como un conjunto de bosones es equivalente a un conjunto de oscila- 
dores, ha de ser posible expresar cualquier función simétrica de las varia- 
bles del bosón en función de las variables y y 7 del oscilador. La ecua- 
ción (10) nos proporciona un ejemplo de ello con 7 a sustituido por 
Na. Veamos qué ocurre en general. Consideremos en primer lugar una fun- 
ción de las variables del bosón de la forma 

Ur = s Us (22) 
r 


siendo cada U, función solamente de las variables dinámicas del bosón 
r-ésimo, de donde su representante <a“|U Ja?> únicamente se refiere a los 
kets básicos Jo» del bosón r-ésimo. Para que Ur sea simétrica, este repre- 
sentante ha de ser el mismo para todo r, luego sólo puede depender de 
los dos autovalores simbolizados por a y b. Para abreviar podemos, pues, 

escribirlo 
<asjU, ja?) = <arjUla?> = <a[Ulb> (23) 

Tenemos 
U laa) = 2 la3: añ... <a |x,>. (24) 
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Sumando esta ecuación para todos los valores de r y aplicando el operador 
de simetrización S a ambos miembros, obtenemos 


SUrlaz 03...» = Y Y Slañ añ...a2 ...<ajUlx,>. (25) 
Como Ur es simétrica podemos reemplazar SUy por UnS y sustituir enton- 


ces los kets simétricos de (25) por sus expresiones dadas por (17). De este 
modo obtenemos 


UN, Mz, 10) = 7 Y Mo 79,9, -+-10><a]Ulx,> 
= Y te Y T2n,0,, >>> 10802 <ajUlb>, (26) 
ab r 


To, significa que el factor 7, ha de ser suprimido. A partir de (15) y de las 
relaciones de conmutación (11) se tiene 


79M, ::102 = 279,9, 1028, (27) 


(obsérvese que 7), actúa como el operador de derivación parcial 2/29mp). 
de donde (26) da 


Ur Na, Maz---10) = Y No To Ne, 7 a, =[0><aJU|b>. (28) 
ad 


Los kets 7], 1 ,, .../0> forman un conjunto completo, luego, a partir de (28) 
podemos inferir la ecuación entre operadores 


Ur = 2 M<XajU|b>7». (29) 
ab 


que nos da Ur en función de las variables y y % y de los elementos de 
matriz <alU|b>. 

Tomemos ahora una función simétrica de las variables del bozón que 
consista en una suma de términos referidos cada uno a dos bosones. 


Voe= Y Vo, (80) 


r,jsXtr 


No necesitamos suponer V,s = Var. De acuerdo con (33), a fin de abre- 
viar, podemos escribir los elementos de matriz de V,. en la forma 


<acoblV_ laca) = <abiVicd> (31) 
Procediendo como antes, obtenemos el resultado correspondiente a (25) 


SVojañas..>= Y Y Slanar...o...a?...><ablVlxxa> (32) 


rsfr ab 
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y el que corresponde a (26) 
Vr Na, Ny, ++"10> — y Mm » MITIN, N, 0,342, <ab|Vjcd). (33) 


abcd 


Por generalización de (27) podemos deducir 


MMM, 00) = Y TIREN A, ++ 10)800,Bae, > (34) 


r,aér 


de donde (33) da 
Vo N As, ...¡0> = > Na Neo NaNo, No, ...|0><ab|V |cd>, 
abed 


que nos lleva a la ecuación entre operadores 


Vr = Y nm<ablVicd> Toa. (35) 
abed 
El método puede generalizarse fácilmente para expresar cualquier fun- 
ción simétrica de las variables del bosón en función de las 7 y las 7). 
La teoría precedente puede generalizarse con facilidad para aplicarla 
a un conjunto de bosones en interacción con algún otro sistema dinámico 
como, por ejemplo, el átomo. Tendremos que introducir un conjunto de 
kets básicos |X'> para el átomo solo. A partir de ellos podemos obtener un 
conjunto de kets básicos para el sistema total, formado por el átomo y 
los bosones, multiplicando cada ket |Z'> por cada uno de los kets (9). 
Podemos escribir estos kets 


Un Ms Rs A cs (36) 


Consideremos el sistema como compuesto por el átomo en interacción con 
un conjunto de osciladores, pudiéndose describir entonces en función de 
las variables del átomo y de las variables Na, %a de los osciladores. Volviendo 
a usar el ket standard j0> del conjunto de osciladores, tenemos 


Siz/atadg”...> = afro». JOE, (37) 


en correspondencia con (17), como ecuación que expresa los kets básicos 
(36) en función de las variables del oscilador. 

Cualquier función de las variables del átomo y de las variables de los 
bosones que sea simétrica respecto a todos los bosones puede expresarse 
como función de las variables del átomo y de las 7 y 7. Consideremos en 
primer lugar una función Ur de la forma (22) con U, función solamente 
de las variables del átomo y de las variables del bosón r-ésimo, cuyo 
representante será pues <Z'a*]U,|£a*>. Este representante ha de ser inde- 
pendiente de r para que Ur pueda ser simétrica respecto a todos los boso- 
nes, luego, podemos escribirlo <Z'a"JUIZ”a?>. Definamos ahora <alUlb> 
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como la función de las variables atómicas cuyo representante sea 
<a U|”a?>; tenemos pues 


<CoanlU Jg"ar> = <Fa(UlE”a"> =<E <a Ub E", (38) 


en correspondencia con (23). Podemos recurrir ahora a las ecuaciones 
(24) - (28) y aplicarlas multiplicando previamente ambos miembros por 
1£'> a la derecha, de donde se deduce que la fórmula (29) continúa siendo 
válida. Podemos tratar análogamente la función simétrica Vr de la for- 
ma (30), con V,, función solamente de las variables atómicas y de las varia- 
bles de los bosones r-ésimo y s-ésimo. Definiendo <ab|Vicd> como la fun- 
ción de las variables atómicas cuyo representante es 


Ea av, 16 a 05), 


la fórmula (35) continúa siendo válida. 


61. Emisión y absorción de bosones 


Supongamos que los osciladores de la sección anterior son armónicos 
que no hay interacción entre ellos. La energía del oscilador a-ésimo es, 
según (5) de S 34, 
H. = hWe Na Ta + 3h04. 


Despreciaremos el término constante 340, que es la energía del oscilador 
en su nivel más bajo — el llamado “punto cero de energía” —. Esta omi- 
sión no tiene ninguna consecuencia dinámica, como queda explicado al 
principio de $ 30, e implica simplemente una nueva definición de H.. 
La energía total de todos los osciladores es ahora 


Hp = Y H, = Y Tios Ma — Eto, na (39) 


con la ayuda de (12). Es de la misma forma que (10) con fñw, en lugar 
de H”. Así pues un conjunto de osciladores armónicos es equivalente a un 
conjunto de bosones en estados estacionarios sin interacción entre ellos. 
Si un oscilador del conjunto está en su estado cuántico Y, hay vn” bosones 
en el estado bosónico asociado. 

En general, el hamiltoniano del conjunto de osciladores será una serie 
de potencias en las variables n, 7, o sea, 


Hy — Hp -h s (Us Na +44 Ma) +4 S (Us Ya Tb + Vab Ya Un + Vo Ta Tv) + e... 
a ab (40) 


donde Hp, U,, Un», Vas son números, siendo Hp real, y Us = Uba. Si el 
conjunto de osciladores está en interacción con un átomo, como teníamos 
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al final de la sección precedente, el hamiltoniano total será también de la 
forma (40), con Hp, Us, Us», Var funciones de las variables atómicas siendo 
en particular Hp el hamiltoniano del átomo. El estudio general de este 
sistema dinámico sería más bien complicado y para las aplicaciones prác 
ticas se supone que los términos 


Hp» + $ Usaijo To (41) 


son grandes en comparación con los otros y constituyen por sí solos un 
sistema no perturbado; los restantes términos se consideran como una 
perturbación que produce transiciones en el sistema no perturbado, de 
acuerdo con la teoría de $ 44. Si además U,, es independiente de las va- 
riables atómicas, el sistema sin perturbar cuyo hamiltoniano es (41) está 
formado simplemente por un átomo de hamiltoniano Hp y un conjunto 
de bosones en estados estacionarios con el hamiltoniano en la forma (39) 
sin interacción. 

Consideremos qué clases de transiciones producen los diversos términos 
de perturbación de (40). Sea un estado estacionario del sistema sin pertur- 
bar para el cual el átomo está en un estado estacionario E”, y los bosones 


permanecen en los estados bosónicos estacionarios, a, b,c, .... Este estado 
estacionario para el sistema sin perturbar corresponde al ket 
Ha Mo Mo -.-10>E”>, (42) 


análoga a (37). Si se multiplica este ket por el término U, 7, de (40), el 
resultado es una combinación lineal de kets del tipo 


No Na o Mo --10>E”>, (43) 


en la cual 2” es cualquier estado estacionario del átomo. El ket (43) 
representa un estado con un bosón más que el ket (42); este bosón extra 
está en el estado x. Luego el término de perturbación U, 7), origina tran- 
siciones en las que se emite un bosón en el estado x y el átomo pasa a un 
estado arbitrario. Si aplicamos el término U, 7, de (40) al ket (42), el re- 
sultado es cero a no ser que (42) contenga un factor 7), en cuyo caso será 
una combinación lineal de kets de la forma 


Me * Ma To Mo -.-10>187>, 


con un bosón menos en el estado x. Luego el término de perturbación 
O, 72 origina transiciones en las que se absorbe un bosón del estado x, y 
el átomo pasa también a un estado arbitrario. Análogamente puede verse 
que un término de perturbación Uy Na 7, (x 4 y) origina procesos en los 
que se absorbe un bosón en el estado y y se emite uno en el estado x, o, 
lo que es lo mismo desde el punto de vista físico, un bosón hace una 
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transición del estado y al estado x. Este tipo de procesos sería producido 
por un término como Ur de (22) y (29) en la energía de perturbación, 
cuyos elementos diagonales <ajUla> fueran nulos. Por otra parte los tér- 
minos de perturbación Voy Tu y» Vay Ta y originan procesos en los que 
son emitidos o absorbidos dos bosones, y así sucesivamente para términos 
más complicados. En cualquiera de estos procesos de emisión y absorción 
el átomo puede pasar a un estado arbitrario. 

Determinemos la dependencia de la probabilidad de que ocurra cada 
uno de estos procesos de transición respecto a la distribución original de 
bosones en los diversos estados bosónicos. Según $$ 44 y 46 la probabili- 
dad de transición es siempre proporcional al cuadrado del módulo del 
elemento de matriz de la energía de perturbación, que hace referencia a 
los dos estados en cuestión. Así pues la probabilidad de que un bosón 
sea emitido en el estado x y que el átomo pase simultáneamente del esta- 
do Z' al estado X” es proporcional a 


[<Enn...(1, + D)...JU,, [m1 12) Y (4% 


las n, son el número de bosones presentes inicialmente en los diversos 
estados bosónicos. De (6) y (17), teniendo en cuenta (4), resulta 


man. = (0. pm 0), 129) 
y asl pues 


7 Mn. 0...» = (1 + 1)n 41... +1)...>. (46) 


Luego, (44) es igual a 
(1, + 1) <2"10,8'> [P, (47) 


es decir, que la probabilidad de una transición en la que se cmite un 
bosón en el estado x es proporcional al número de bosones que estaban 
anteriormente en el estado x, más uno. 

La probabilidad de que sea absorbido un bosón en el estado x y que 
el átomo pase simultáneamente del estado Z' al estado £” es proporcional a 


|< me — 1D)... 0 7 nn o E Y (48) 
donde las ní, igual que antes, son el número de bosones presentes inicial- 
mente en los diversos estados bosónicos. De (45) 

7 ¿nn 0.» = M4 nn ...(n. —1)...>, (49) 
luego, (48) es igual a 
ASAS (50) 


Es decir, la probabilidad de que tenga lugar una transición en la que se 
absorba un bosón en el estado x es proporcional al número de bosones 
originalmente en el estado x. 
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Pueden aplicarse métodos análogos para procesos más complicados y 
ver que la probabilidad de que un bosón haga una transición del estado y 
al estado x (x 7 y) es proporcional a n (n” +4 1). Más en general, la proba- 
bilidad de que sean absorbidos bosones en los estados x, y, ... y emitidos 
- en los estados a, b, ... es proporcional a 


nn ...(n, + 1), + 1)... (51) 


siendo las ny en cada caso el número de bosones presentes inicialmente. 
Estos resultados valen para procesos de transición directa y para procesos 
de transición que se realizan a través de uno o más estados intermedios, 
de acuerdo con la interpretación dada al final de $ 44. 


62. Aplicación a fotones 


Puesto que los fotones son bosones, puede aplicárseles la teoría pre- 
cedente. Los estados estacionarios de un fotón son los autoestados de su 
momento. Para cada autoestado del momento existen dos estados de pola- 
rización independientes, para los cuales pueden elegirse dos estados de 
polarización lineal en direcciones perpendiculares. Las variables dinámi- 
cas necesarias para describir los estados estacionarios son en este caso el 
vector momento p y una variable de polarización 1 consistente en un 
vector unidad perpendicular a p. Las variables p y 1 ocupan el lugar de 
las « anteriores. Los autovalores de p son todos los números desde —oo 
a co para cada una de las tres componentes cartesianas de p, y para cada 
autovalor p” de p, l tiene solamente dos autovalores que corresponden a 
dos vectores escogidos de manera arbitraria, perpendiculares a p” y per- 
pendiculares entre sí. Puesto que los autovalores de p forman un intervalo 
continuo, existirá un conjunto continuo de estados estacionarios que cons- 
tituyen los kets básicos continuos |[p'Y>. En cambio, la teoría precedente 
se construyó para un conjunto discreto de kets básicos |a”> de un bosón. 
Podemos recurrir a dos formalismos para eliminar esta discrepancia. 

El primero consiste en reemplazar la distribución continua tridimen- 
sional de autovalores de p por un gran número de puntos discretos situa- 
dos muy cerca unos de otros y formando una nube esparcida sobre todo el 
espacio p tridimensional. Sea s,, la densidad de la nube (número de puntos 
por unidad de volumen) en las proximidades de cualquier punto p”. Por 
consiguiente, Sp, ha de ser grande y positivo, pero aparte de eso puede ser 
una función arbitraria de p'. Las integrales sobre el espacio p pueden 
reemplazarse por sumas extendidas a la nube de puntos, de acuerdo con 
la fórmula 


NS dp, dp, dp. = Y fs, (52) 
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la cual nos proporciona la base para el paso de los valores de p” continuos 
a los discretos y viceversa. Cualquier problema puede plantearse en tér- 
minos de los valores discretos de p”, para los cuales puede usarse la teoría 
de $$ 59 - 61, y los resultados pueden transformarse de nuevo para refe- 
rirlos a los valores continuos de p”. La densidad arbitraria sp. desaparece 
entonces de los resultados. 

El segundo formalismo consiste en modificar las ecuaciones de la teoría 
de $$ 59-61 de modo que se apliquen al caso de un conjunto de kets 
básicos |a> continuo, reemplazando sumas por integrales y el símbolo 8 
de las relaciones de conmutación (11) por las funciones 3 en lo que con- 
cierne a las variables con autovalores continuos. Cada uno de estos forma- 
lismos tiene sus ventajas y sus inconvenientes. El primero suele ser más 
conveniente para la discusión física, y el segundo para el desarrollo 
matemático. Desarrollaremos los dos y emplearemos uno u otro según nos 
convenga en cada momento. 

El hamiltoniano que describe un conjunto de fotones en interacción 
con un átomo tendrá la forma general (40), con coeficientes Hp, U¿, Uas, 
Va» que contienen las variables atómicas. Este hamiltoniano puede escri- 
birse 

Hy = Hp»+ Hq+ Hz, (53) 


donde Hp es la energía del átomo solo, Hz la energía del conjunto de 
fotones aislado | 
He = X Mp1 hw, (54) 
p Y 
— vp, es la frecuencia de un fotón de momento p'—, y Ho es la energía 
de interacción que puede calcularse por analogía con la teoría clásica 
como veremos en la sección siguiente. El sistema global puede tratarse 
por un método de perturbación como el de la sección precedente, con Hp 
y Hz en el lugar de la energía (41) del sistema no perturbado y Hg como 
energía de perturbación que origina las transiciones con emisión y absor- 
ción de fotones y pasos simultáneos del átomo de un estado estacionario 
a otro. 

Vimos en la sección anterior que la probabilidad de que tenga lugar un 
proceso de absorción es proporcional al número de bosones que estaban 
inicialmente en el estado en que es absorbido el bosón. Podemos deducir 
de ello que la probabilidad de que un fotón procedente de un haz de 
radiación que incide sobre un átomo sea absorbido es proporcional a la 
intensidad del haz. Vimos también que la probabilidad de un proceso 
de emisión es proporcional al número de bosones presentes anteriormente 
en el estado dado más uno. Para interpretar este resultado hemos de hacer 
un estudio cuidadoso de las relaciones implicadas al reemplazar el con- 
junto continuo de estados fotónicos por un conjunto discreto. 


252 "TEORÍA DE LA RADIACIÓN 


Despreciemos por ahora la variable de polarización 1. Sea |p'D> el ket 
normalizado correspondiente al estado fotónico discreto p'. Entonces se- 
gún (22) de $ 16 

Y [po<p»| = 1, 
> 


que da, según (52), 
f ¡p'D><p'D|sp. dp” = 1, (59) 


habiendo escrito para abreviar d*p' en lugar de dp”,dp',dp!. Si |p!> es el 
ket básico correspondiente al estado continuo p”, según (24) de $ 16, te- 
nemos 


f ¡p><pidp" = 1, 
que muestra, comparando con (55) que 


Ip> = [p'Ds*, (56) 


La, relación entre |p'> y [p'D> es análoga a la que existe entre los kets bási- 
cos al cambiar la función peso de la representación; véase (38) de $ 16. 

Si tenemos ní,, fotones en cada estado fotónico discreto p”, la densidad 
de Gibbs p para el conjunto de fotones es, según (68) de $ 33, 


p=2 [p'D>n, <p'D| = j [p'D>9,, <p'Dlsp. dp” 


= | (9n, mdp" (57) 
con la ayuda de (56). El número de fotones por unidad de volumen en el 
entorno de un punto cualquiera es, por consiguiente, <x'|plx”>, según (13) 
de $ 33. 

Según (57), al introducir el valor de la función de transformación 
<x'Ip> dada por (54) de $ 23, da como resultado 


apor = | em <p> dp” 
E j hn, dp” (58) 


La ecuación (58) expresa el número de fotones por unidad de volumen 
como una integral sobre el espacio de los momentos, luego, el integrando 
de (58) puede interpretarse como el número de fotones por unidad de 
volumen del espacio de fases. Llegamos de esta manera al resultado que 
el número de fotones por unidad de volumen del espacio de fases es igual 
a hi3 veces el número de fotones por estado discreto, o dicho de otro 
modo, una celda de volumen h3 en el espacio de fases es equivalente a 
un estado discreto. Este resultado es general y válido para cualquier clase 
de partículas. Si se tiene en cuenta la variable de polarización de los 
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fotones, el resultado vale para cada uno de los dos estados de polarización 
independientes. 

La magnitud del momento de un fotón de frecuencia y es hv/c, luego, 
el elemento del espacio de momentos es 


dp.dpydp, = h3cr3dydo, 


siendo de un elemento de ángulo sólido en la dirección del vector p. Así 
pues, una distribución de fotones que contenga 1”, fotones por estado dis- 
creto, o lo que es equivalente, una distribución de h"3nf£d*pd*x fotones 
por elemento de volumen d*x y un elemento del espacio de momentos d*p, 
es igual a una distribución de n'pc”*v2dvduod?x fotones por elemento de 
volumen dx, por intervalo de frecuencia dy y por elemento de ángulo 
sólido du en la dirección p del movimiento. Esto corresponde a una den- 
sidad de energía nhc”3y* por unidad de ángulo sólido y por unidad de 
intervalo de frecuencia, o a una intensidad por unidad de intervalo 
de frecuencia (que es la energía que atraviesa la unidad de área por 
unidad de tiempo y por unidad de intervalo de frecuencia) de valor 


L, = n,hw/e. (59) 


p 


El hecho de que la probabilidad de emisión de un fotón sea propor- 
cional a n, + 1, siendo n/,, el número de fotones que inicialmente están 
en el estado discreto dado, puede interpretarse ahora como que la proba- 
bilidad es proporcional a 1,, + hw*/c?, donde I,, es la intensidad de la 
radiación incidente por unidad de intervalo de frecuencias en el entorno 
de la frecuencia del fotón emitido y con su misma polarización 1. Por 
consiguiente, incluso cuando no incide radiación sigue existiendo una 
cierta emisión, pero la emisión resulta incrementada o estimulada por la 
radiación incidente en la misma dirección y con la misma frecuencia y 
polarización de la radiación emitida. La teoría de la radiación aquí desa- 
rrollada completa de este modo la teoría deficiente de $ 45, justificando 
tanto la emisión estimulada como la espontánea. La relación que da para 
los dos tipos de emisión, 1,, : hy?/c?, está en concordancia con la que pro- 
porciona la teoría de Einstein del equilibrio estadístico, mencionada en $ 45. 

La probabilidad de que en un experimento de dispersión pase un fotón 
del estado pY al estado p”1” es proporcional a n,,¡.(Mprj» + 1), donde las n 
son el número de fotones que estaban inicialmente en los estados dis- 
cretos dados. Podemos interpretar este resultado diciendo que la proba- 
bilidad es proporcional a 


LD (Lyrjo + hw?/02). (60) 


De manera semejante para un proceso de radiación más general en el que 
se emiten y absorben varios fotones, la probabilidad es proporcional al 
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factor 1,, para cada fotón absorbido y al factor 1,, + hw*/c* para cada 
fotón emitido. Luego, el proceso es estimulado por la radiación incidente 
en la misma dirección y con la misma frecuencia y polarización que los 
fotones emitidos. 


63. La energía de interacción de los fotones con un átomo 


Vamos a determinar ahora la energía de interacción entre un átomo y 
un conjunto de fotones, es decir, la Hg de la ecuación (53), por analogía 
con, la expresión clásica de la energía de interacción entre un átomo y un 
campo de radiación. Para simplificar supondremos que el átomo está for- 
mado por un solo electrón que se mueve en un campo de fuerzas electros- 
tático. El campo de radiación puede describirse mediante un potencial 
escalar y un potencial vector. Estos potenciales no están univocamente 
determinados y pueden escogerse de manera que el potencial escalar 
desaparezca. El campo queda entonces completamente determinado por 
el potencial vector Az, Ay, A¿ O A. El cambio en el hamiltoniano que 
describe el átomo producido por el campo es, según hemos visto al prin- 
cipio de $ 41, 

4 2 
Ho = (+A) A E 
2m | C / mec 

Ésta es la energía clásica de interacción. El A de esta expresión tendría 
que ser el valor del potencial vector en el punto en que está situado el 
electrón en el instante considerado. Sin embargo, si tomamos para Á 
el valor del potencial vector en algún punto fijo del átomo, como por ejem- 
plo el núcleo, resulta una aproximación suficientemente buena, siempre que 
se trate de radiaciones cuya longitud de onda sea grande en comparación 
con las dimensiones del átomo. 

Consideremos primero clásicamente el campo de radiación e ignoremos 
su interacción con el átomo. Según la teoría de Maxwell, el potencial vec- 
tor satisface las ecuaciones | 


DA=0,  divA=0, (62) 


KO simboliza 0?2/c*0t? — 02/0x? — 92/0y? —0?/02?2. La primera ecuación 
nos dice que A puede descomponerse en componentes de Fourier de la 
forma 





A?. 
2mc? (61) 


A =) LA y ex) +2ori0 pt 4 A, e (kx) -2ri"ggt) 3, (63) 


Cada componente de Fourier representa un tren de ondas que avanza con 
la velocidad de la luz, dado por un vector k cuya dirección da la dirección 
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de movimiento de las ondas y cuya magnitud |k| está relacionada con su 
frecuencia y, por 


2%. = clk]. (64) 


El vector k es precisamente el momento del fotón que la teoría cuántica 
asociaría con estas ondas dividido por h. Para cada valor de k tenemos una 
amplitud A,, que, en general, es un vector complejo, y la integral de (63) 
se extiende sobre todo el espacio tridimensional de las k. La segunda de las 
ecuaciones (62) da 


(k, Ay) == 0, (65) 


que nos dice que para cada valor de k, A, es perpendicular a k. Esto 
expresa que las ondas son transversales. A, está determinado por sus dos 
componentes en dos direcciones perpendiculares entre sí y a su vez per- 
pendiculares a k; estas dos componentes corresponden a dos estados de 
polarización lineal independientes. 

La energía total de radiación viene dada por la integral de volumen 


Hz = (81) j (E2 + 442) dix (66) 


extendida a todo el espacio; el campo eléctrico € y el campo magnético H 
vienen dados por 


l YA 
é = —=- ——, FH = rot A. (67) 


Usando fórmulas conocidas del análisis vectorial, resulta 


divíA XH] = (4%, rot A) —(A, rot H) = H?—-(A, rot rot A) 
= H?+(A, VA) 


con la ayuda de la segunda ecuación (62). De este modo, despreciando un 
término que puede transformarse en una integral de superficie extendida 
a la superficie del infinito, (66) se convierte en 


ES oA 


1 
— (8092 (4 
cala a 


) —(A, V2A) | dx. (68) 

Sustituyendo A en esta expresión por su valor (63) podemos obtener la 
energía de radiación en función de las amplitudes de Fourier A,. La ener- 
gía de la radiación es constante (puesto que despreciamos la interacción 
de la radiación con el átomo), luego para calcularla podemos tomar t = 0. 
Esto significa tomar 


A =/f (Ax + AJerióo dol, (69) 
VA = —[k (A, + AJe tex) dk, 
0A/0t = ic f [KA —A_,Jert00 dik. (70) 
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Introduciendo estas expresiones en (68), obtenemos, con la ayuda de la 
fórmula (49) de $ 23 


Hp = (87)? SÍ ¡K?(A, + A-u, Ax +A-x:) — 
o k] KIA, e Az, Aj 2 IO d*kd8k d3x 


= 0 f | NAL + Bro A + Ae) — 
— KIA. — Aro Ayo — AU + K) dikdik, 


siendo 3(k + k') el producto de tres factores correspondientes a las tres 
componentes de k. De ahí 


Hp = Y f KA. + Ago Ace + Ax) — (An — Acro Ac — Ax) dk 
-= 2? f (AL Aly) + (Ao A) dk 
— 47 f KA, Aj) dk. (71) 


Podemos reemplazar la distribución de valores de k continua por una nube 
de valores discretos de k, como hicimos con los valores de p en la sección 
anterior. La integral (71) se transforma entonces, según la fórmula (52) en 
la suma 


Hr a 4q- > K(A,, Ax)sk 
k 


siendo s, la densidad de valores discretos de k. Podemos escribirlo también 
en la forma 
Hp = 47? Y KRALAxi So, (72) 
kl 
siendo Ax, la componente de A, en una dirección ] perpendicular a k 
y estando referida la sumación respecto a 1 a dos direcciones 1 perpen- 
diculares entre sí. Es decir, en (72) hay un término para cada estado esta- 
cionario de un fotón independiente. 
Los valores € y 4 del campo en un punto cualquiera pueden tomarse 
como variables dinámicas. Las cantidades 


a 2TUvkt A je A kt 
Art — Áx: ganas, Ar = Ax: pas , 


son entonces variables dinámicas en el instante t, puesto que están ligadas 
a € y H en diversos puntos x y en el instante £ por ecuaciones que no 
contienen la t, como se deduce de (63) y (67). Ax, es constante, luego, 
A. ¡, varía con t según una ley armónica simple. Por lo tanto, Ay1+ hace 





¡qxr->___Q-”_.——_ —— e A A 
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el papel de la 7, de un oscilador armónico, definido por (3) de $ 34, donde 
la e del oscilador es 2rv,. Podemos tomar cada Ax. proporcional a la n, 
de un oscilador armónico, y entonces el campo de radiación se convierte 
en un conjunto de osciladores armónicos. 

Pasemos a la teoría cuántica y tomemos Ay: Ax. como variables di- 
námicas en la imagen de Heisenberg. La expresión (72) de la energía puede 
conservarse, si bien ahora el orden en que aparecen los factores Ay, y 


Ax, no puede modificarse si no queremos que aparezca un punto cero de 


energía. Las Ax. continúan variando con el tiempo de acuerdo con la ley 
evi e igual que antes pueden tomarse proporcionales a las 7, de oscila- 
dores armónicos. El factor de proporcionalidad puede obtenerse igualan- 
do (72) a la expresión (39) de la energía, sustituyendo en ella el símbolo a 
por los dos simbolos k y 1, y ño, por hy. Esto nos da 


pa 2 A 1 _ 
47 2 KArAris,) = 2 PYR Oia iento 
kl j kl 
Introducimos el subíndice £ para indicar que trabajamos con variables 
dinámicas de Heisenberg (como hemos de hacer cada vez que pasamos 
ecuaciones de la teoría clásica a la teoría cuántica). De ahí, usando (64), 


ARA pe = Chibi (13) 


despreciando un factor de fase arbitrario sin importancia. De este modo 
se introducen las variables dinámicas de Heisenberg 7x1 que describen 
el campo de radiación como un conjunto de osciladores. Las relaciones de 
conmutación entre 7x1: y xi, Son conocidas y están dadas por (11), luego, 
la ecuación (73) fija las relaciones de conmutación entre Aj: y Áxrs 
En consecuencia, fija también las relaciones de conmutación entre los po- 
tenciales A. y los valores del campo € y Men los diversos puntos x y en 
el instante t. (Incidentalmente las relaciones de conmutación entre Ax; y Ax: 
no dependen del tiempo, y, por consiguiente, la relación de conmutación 
entre dos potenciales o dos cantidades que describen el campo en dos 
tiempos distintos tampoco varía con el tiempo.) 

Asimismo podemos usar (73) cuando queremos tener en cuenta la in- 
teracción entre el campo de radiación y el átomo. Esta afirmación implica 
suponer que la interacción no afecta a las relaciones de conmutación entre 
los potenciales y las cantidades que describen el campo en un instante 
dado. La interacción hace que las 7x1. dejen de variar de acuerdo con la 
ley armónica simple y que los osciladores dejen de ser armónicos. Por 


consiguiente, podría afectar a la relación de conmutación entre dos po- 


tenciales o dos cantidades que describen el campo para dos instantes dis- 
tintos. 

Podemos introducir ahora la energía de interacción (61) en la teoría 
cuántica sustituyendo p por p;, para indicar que es una variable dinámica 


17, — CUÁNTICA 
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de Heisenberg. Tomando el núcleo atómico como origen, al sustituir (63) 
con x = 0 en (61), obtenemos 


e da 
Ho: = E] (Ds An: + Ars) dk 4 


el 
mc? 





Re ffas + Aro Ag: + Ax: 1) EkdN 


e | _ el a en a 
= Y (DP: Ax: + Ani)s + ña ys (Aye + Ago Agr + A) Ss 


kk” 


si pasamos de valores continuos de k a valores discretos. Luego, 
e A -1 

Ha = —- 3 PulAra: + Ar11)8, le 
mc <= 


e - S TN 
o O O A A 


EN 
2mc” 


donde py: es la componente de p; en la dirección 1. Con la ayuda de (73) 
podemos expresar Ho, en función de xi Y Mur» y eliminar entonces el 
subíndice t (lo que significa pasar a las variables dinámicas de Schródin- 
ger, obteniéndose finalmente | 


eh 


42m 


e2h E e AE 
=— Y ba ha + Ta) (Mer + The MAY) sjisgA > (78) 
327 m k k'11/ 


Ho = 





2, PO Ma + Ted se + 
k 


Para el modelo de átomo que empleamos, la energía de interacción 
aparece como una función lineal más una función cuadrática en las $ y 
las 7. Los términos lineales originan procesos de emisión y absorción, y los 
cuadráticos procesos de dispersión y procesos en los que se absorben o 
emiten dos fotones simultáneamente. El orden de los factores y v 7 en los 
términos cuadráticos no queda determinado por el método empleado en la 
teoría clásica, pero no tiene importancia puesto que un cambio del orden no 
modifica a Hg más que en una constante. 

El elemento de matriz de Ho relativo a la emisión de un fotón en el 
estado discreto kl, o lo que es lo mismo, en el estado discreto p'1 como 
también puede designarse, acompañada del salto del átomo del estado a” 
al estado a, es 


e 


eh 
, 0y — 0 ey — , 0s e + 
<p plx"H ola ? =— 4xr2my* <a pla 28 K “7 mh(2rv)? <a pila >Sp 


puesto que Sk = Sph?. El p, que figura aquí, y que se refiere al momento 
del electrón es, por supuesto, totalmente distinto de las otras letras p, que 
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se refieren al momento del fotón emitido. Para evitar confusivnes reem- 
plazaremos el momento p del electrón por mx, ya que, para el átomo sin 
perturbar, estas dos variables dinámicas son una misma. Pasando a esta- 
dos continuos del fotón mediante la imaginaria conjugada de la ecua- 

ción (56), obtenemos | 


<p loa Hola> = <a Xx Jao>. (75) 


e 
h(Qry) 
Análogamente, el elemento de matriz de Ho relativo a la absorción de un 
fotón en el estado continuo p*l, pasando el átomo simultáneamente del 
estado a al estado 2! es 


<a Holpila) = + <a Xx la0>, (76) 


e 

(279)? 
y el elemento de matriz relativo a la dispersión de un fotón desde el estado 
continuo p'1* al estado continuo p'Y con el átomo saltando del estado a? 
al estado a” es 


o 


e 


mv, 00 ,,0 A 
<pYa"¡Holpla> —= Sm hamy0E TN 


119%, ¿o (TD) 
para el cual hay dos términos de (74) que dan contribución no nula. En la 
próxima sección emplearemos estos elementos de matriz. Los elementos 
de matriz relativos a la absorción o emisión simultánea de dos fotones 
pueden obtenerse de la misma manera, pero conducen a efectos físicos 
demasiado pequeños para ser de importancia práctica. 


64. Emisión, absorción y dispersión de la radiación 


Podemos determinar ahora directamente los coeficientes de emisión, 
absorción y dispersión de radiaciones sustituyendo en las fórmulas del ca- 
pítulo VIII los valores de los elementos de matriz dados por (75), (76) y (77). 

Para determinar la probabilidad de emisión podemos usar la fórmu- 
la (56) de $ 53. Nos dice que para un átomo en un estado a? la probabi- 
lidad por unidad de tiempo y por unidad de ángulo sólido de que emita 
espontáneamente un fotón y pase a un estado a” de menor energía es 


4 WPle 1 > .,,.P dk 
+ TETA pay ia, 0 


Ahora bien, la energía y el momento de un fotón de frecuencia y son 


W = hy, P = hy/c. 
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Además, de la ley de Heisenberg (20) de $ 29, 
| | <a lx la0> —= —2riv(aa <a xao, 


donde v(a%x/) es la frecuencia asociada a las transiciones del estado a? al 
estado q, que en nuestro caso es precisamente la frecuencia y de la radia- 
ción emitida. Estos resultados sustituidos en (78) reducen el coeficiente 
de emisión a V 

(2mv)* 


pl <xexjja0> [P. (79) 





Para obtener la cantidad de energía emitida en la unidad de tiempo por 
unidad de ángulo sólido con una polarización dada tenemos que multi- 
plicarlo por hy. Con ello, el coeficiente total de emisión de energía en 
todas direcciones será 


4 (Qmy)! 


S | aexdo [, (80) 





que está de acuerdo con la expresión (34) de $ 45 y justifica la hipótesis 
de Heisenberg para la interpretación de sus elementos de matriz. 
De la misma manera el coeficiente de absorción, dado por la fórmula 

(59) de $ 53, se convierte para fotones en 

4ehWwje 1 2 8mvy 

— Ep Y (2) <a (Xx ja0> = <a exya0> |. 
Este coeficiente de absorción se refiere a un haz incidente que contiene 
un fotón por unidad de intervalo de energía que atraviesa la unidad de 
área en la unidad de tiempo. Si en lugar de por unidad de intervalo 
de energía tomamos por unidad de intervalo de frecuencia, como se suele 
hacer cuando se trata de radiaciones, el coeficiente de absorción resulta ser 


5 Dos 
men a lexyja2> |?. 
Este resultado es el mismo que (32) de $ 45, si en él sustituimos E, por la 
energía hy de un solo fotón. De este modo la teoría elemental de $ 45, en 
la que se considera el campo de radiación como una perturbación externa, 
da el valor correcto para el coeficiente de absorción. 

Esta concordancia entre la teoría elemental y la presente teoría podría 
deducirse de argumentos generales. Las dos teorías difieren solamente en 
que las cantidades que describen el campo conmutan entre sí en la teoría 
elemental y, en cambio, en la presente teoría satisfacen unas relaciones 
de conmutación definidas, diferencia que resulta sin importancia para 
campos fuertes. Por lo tanto, las dos teorías han de dar la misma emisión 
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y absorción cuando intervienen campos fuertes. Como las dos teorías dan 
el coeficiente de absorción proporcional a la intensidad del haz incidente, 
la concordancia ha de mantenerse también para campos débiles en el caso 
de la absorción. De la misma manera la parte de emisión estimulada de la 
presente teoría ha de coincidir con la emisión en la teoría elemental. 

Consideremos ahora la dispersión. El coeficiente de dispersión directa 
viene dado por la fórmula (38) de $ 50. Esta dispersión de fotones no irá 
acompañada por ningún cambio en el estado del átomo, debido a la pre- 
sencia del factor 3,.,o en la expresión del elemento de matriz (77). Luego, 
la energía final W” del fotón será igual a su energía inicial W“. El coefi- 
ciente de dispersión queda reducido a 

es/m?ct . (VIO?. 
Es el mismo que da la mecánica clásica para la dispersión de radiación por 
un electrón libre. Vemos, pues, que la dispersión directa de radiación 
por un electrón en un átomo es independiente del átomo y viene dada 
correctamente por la teoría clásica. Recordemos que este resultado sólo 
es válido cuando la longitud de onda de la radiación es grande en compa- 
ración con las dimensiones del átomo. 

La dispersión directa es un concepto matemático y no puede separarse - 
experimentalmente de la dispersión total, dada por la fórmula (44) de 
$ 51. Veamos cuál es esta dispersión total en el caso de fotones. Hemos 
de ir con cuidado al aplicar la fórmula (44) de $ 51. La sumación >, en esta 


fórmula representa la contribución a la dispersión de transiciones dobles, 
consistentes en transiciones primeramente del estado inicial al estado k y 
luego del estado k al estado final. La primera transición puede ser una 
absorción del fotón incidente y la segunda una emisión del fotón disper- 
sado, pero también es posible que tenga primero lugar la emisión y des- 
pués la absorción. La naturaleza general del método usado para deducir 
la fórmula (44) de $ 51 pone de manifiesto que cuando se aplica a fotones 
han de incluirse los dos tipos de transición doble en la sumación >, aunque 


en la deducción dada en $ 51 solamente aparezcan las del primer tipo 
debido a que allí no se tuvo en cuenta la posibilidad de que la partícula 
fuera creada o aniquilada. 

Empleamos los superíndices cero, prima y segunda para referirnos res- 
pectivamente a los estados inicial, final e intermedio del átomo, y cero y 
prima para referirnos respectivamente a los fotones absorbidos y emitidos. 
Para la doble transición de absorción seguida de emisión tendremos que 
tomar entonces como elementos de matriz 


<kVip%a0>, <p'oVk> 
en la fórmula (44) de $ 51 los siguientes: 
<kIVip%a0> — <a" ¡Hop lo), <p'aIVIk> = <p Ya Hoa””>. 
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También hemos de tomar 

E! — E, = hw + Hp(a%) — Hola”) = h[v” — v(a”a0)], 
donde 
A hy(a 20) = Hpla”) — Hp(a0). 


Análogamente, para la doble transición de emisión seguida de absorción 
hemos de tomar 


<kIVlp0%)> = <pYaHoja>, — <p IVik> = <v|Holpolla”> 
y 
E'— E, = hvW + Ha?) — H pla) — hw —hY = —h[Y + v(a*20)], 
existiendo ahora en el estado intermedio dos fotones, de frecuencias v* y y. 


Sustituyendo los valores de los elementos de matriz dados por (75), (76) 
y (77) en (44) de $ 51 obtenemos para el coeficiente de dispersión 


ee Y.h 
A Fa y 4 A 
h?ct y a ES 














> ¡<o li ,.[a”><a iola”> <a (Xola ><a x 1. 00> e 
| aaa Y + va 20) E (81) 


Poniendo (81) en función de x en vez de x, obtenemos 





(Que)! Ad ho, ss <a lx.) >< lx po] 00> 
A O] 
EX < xyla”><0 "lx, a0> | |? 
Y + v(a 00) (82) 
Podemos simplificar (82) mediante las condiciones cuánticas. Tenemos 
XX jo — XyoX¡, —= O, 
que da 
Y (<a ix, 10 >< Xola) — (<o [xoja ><a lx 007 = O, (83) 
y también 
XX jo — LX, = 1/mM- (xP — Po.) = ¿AR/m. (11), 
que da 
> <a lx, la> ' E a! an<a lala?» - Ga 190) 3 
1 
103 — (IO ais 
7 Wo == O (88) 


Multiplicando (83) por Y y sumándola a (84) obtenemos 


S (<a, la”> <a di) [v + 9(00'09)] — <ofpenla ><, Ja) [ + (/27)1) 
a = h/2m . (Y10) 0% as 
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Si sustituimos en (82) %/2wm . (11%) 3, por esta expresión, obtenemos 
después de una simplificación directa haciendo uso de relaciones idénticas 
entre las y, 


(Ze)! e S <a lxj1a> Lala yo 100> <a [Xx joa ><a lx 1.100) 
OS RE E 7 FE 0) 


que es el coeficiente de dispersión en la forma de sección eficaz sobre la 
que ha de incidir el fotón por unidad de ángulo sólido de dispersión. Se 
conoce como fórmula de dispersión de Kramer-Heisenberg, y fue obte- 
nida primeramente por estos autores mediante analogías con la teoría 
clásica de dispersión. 

El hecho de que los diversos términos de (82) puedan combinarse 
para dar el resultado (85) justifica la suposición hecha al deducir la fórmu- 
la (44) de $ 51, de que los elementos de matriz <p'w[V|p”a””> de la energía 
de interacción son de segundo orden de magnitud comparados con los 
<p'//VIk> en todo promedio temporal cuando las partículas son fotones. 


2 


(85) 








65. Conjuntos de fermiones 


Un conjunto de fermiones puede estudiarse mediante un método análo- 
go al usado en $$ 59 y 60 para bosones. Con los kets (1) podemos usar el 
operador de antisimetrización A definido por 


A =w 14 y =P, (9) 


donde la suma está extendida a todas las permutaciones P, y con el signo 
+ o — según sea P par o impar. Aplicado al ket (1) da 


ui Y + Platadas...92,) = Alarada”...a0, (3 


ket correspondiente a un estado de un conjunto de u” fermiones, El ket (3” 
está normalizado si los kets Ja“>, la?>, ... de los fermiones individuales son 
todos diferentes, en caso contrario es cero. A este respecto el ket (3” 
es más simple que el ket (3). En cambio (3') es más complicado que (3) 
por el hecho de que (3) depende del orden en que se presentan a”, a?, 
a, .... y cambia de signo cuando se aplica a este orden una permutación 
impar. | 

Podemos introducir igual que antes los números de fermiones n;,, Na, 
nz, ... en los estados a", a(2, a(3, ... y considerarlos como variables di- 
námicas u observables. Cada uno de ellos tiene por autovalores solamente 
O y 1. Forman un conjunto completo de observables que conmutan para 
el conjunto de fermiones. Los kets básicos de una representación con las 
n; diagonales pueden tomarse ligados a los kets (3') por la ecuación 


Alatada”...a0> == + nn nh ...2 (6) 


264 TEORÍA DE LA RADIACIÓN 


correspondiente a (6); las nf están relacionadas con las variables a”, a? 
a”, ... por la ecuación (4.) En (6') es necesario poner el signo +, puesto 
que para unas n” dadas los estados ocupados a”, a”, q”, ... quedan fijados, 
pero no su orden y, por tanto, el signo del primer miembro de (6') tam- 
poco está fijado. Para establecer una regla que determine el signo de (6') 
hemos de componer arbitrariamente todos los estados « de un fermión en 
un orden dado. Las a del primer miembro de (6') son un subconjunto de 
todas las a y el orden establecido para todas las « fijará un orden para el 
subconjunto. Fijemos ahora la siguiente regla: pondremos signo más en (67), 
si las « del primer miembro pueden ponerse en el orden previamente 
establecido, mediante una permutación par, y el signo menos, si para ello 
es necesario aplicar una permutación impar. Debido a la complejidad de 
esta regla la representación con los kets básicos |nín/n”...> no es muy útil. 

Si el número de fermiones en el conjunto es variable, podemos formar 
un conjunto completo de kets | 


e ata Ae. AER as (9) 


correspondiente a (9). Un ket general puede expresarse ahora como com- 
binación lineal de los diversos kets (9”. 

Para continuar con este desarrollo introducimos un conjunto de opera- 
dores lineales 7, 7 (un par de ellos 7,, 7%, para cada estado fermiónico as), 
que verifiquen las relaciones de conmutación 


Ta Yo + Mo Ta E O, 


Na No + Mo Na = 0, 
(117 
Na Tb + To Ma — 0Óab» 


Estas relaciones son iguales a las (11) pero con un signo + en vez de — en 
el primer miembro. Para a b, 7%, y Ma anticonmutan con 7), y 7», mien- 
tras que para b — a dan 


n=. TL. TIENE, (11”) 


Para comprobar que las relaciones (11%) no se contradicen veamos cómo 
pueden construirse operadores %, 7 que verifiquen las condiciones (117). 
Para cada estado a” tomemos un conjunto de operadores lineales 00, Sa, 
Oz como los 07, oy, 9, introducidos en $ 37 para describir el spin de un 
electrón, tales que ya, ya, 9: COnmMutan COn Gym, Gyo, 99 para ba. To- 
memos también un conjunto de operadores lineales í, independientes, uno 
para cada estado a”, que anticonmuten todos entre sí, cuyos cuadrados 
sean la unidad y que conmuten con todas las variables cs. Entonces, po- 
niendo 


Ma = 3% (54 — 15 yu), Yu ¿a l(Oza + la): 
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se satisfacen todas las condiciones (11). 
De (11) 
(Mea Ter = Na Na Ta Na = Mall — Na Mala = Na Ta: 


Que es una ecuación algebraica en Na a de la cual deducimos que 7a Ta 
es un observable cuyos autovalores son O y 1. Además a 7, conmuta con 
To Tp» para b% a. Estos resultados nos permiten poner 


Na Ta —= Ma, (12 
igual que en (12). De (11”) obtenemos ahora 
Ta Ma = 1—nma, (137 


ecuación correspondiente a (13). 
Llamemos 10> al autoket normalizado de todas las n pertenecientes a 
los autovalores cero. Es decir, 


na|0> — 0, 
y, por lo tanto, de (12) 
<0lma Tal0> = 0. 
Luego, 
a!0> = 0, (155 


correspondiente a (15). Además 
<Ofñanaj0> = <0(1—na)/0> = <0/0> = 1, 
y por tanto, NaJ0> está normalizado, y 
na Naj0> = NMañaNal0> = Na (1— No)10> = TalO>, 


o sea, Ma[0> es un autoket de n, perteneciente al autovalor uno. Además, 
es un autoket de las otras n perteneciente a los autovalores cero, puesto 
que las otras n conmutan con 7). Generalizando el argumento vemos que 
Ma To Ne --- 40> está normalizado y es un autoket común a todas las n 
que pertenece a los autovalores uno de n,, Ns, Ne, ... Ny y cero de las 
otras n. Esto nos permite poner 


Alatada”...a0) = TaTjoMo.- Mol0>, (17) 


en donde ambos miembros son antisimétricos con respecto a los símbolos 
a, b, C, ..., g. Corresponde a (17). 

Si consideramos un conjunto diferente de kets básicos |[8%> para un 
fermión, podemos introducir un nuevo conjunto de operadores lineales Na 
en correspondencia con ellos. Encontramos entonces, razonando igual que 
hicimos con los bosones, que las nuevas %4 están relacionadas con las ori- 
ginales por (21). Vemos con ello que hay un procedimiento de segunda 
cuantificación para fermiones, similar al de bosones, con la única diferen- 
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cia de que para fermiones han de emplearse las relaciones de conmuta- 
ción (11) que reemplazan a las relaciones de conmutación (11) que se 
aplican para bosones. 

Un operador lineal simétrico Us de la forma (22) puede expresarse en 
función de las variables 7j, % por un método análogo al empleado para 
bosones. La ecuación (24) continúa siendo válida e igualmente la (25) 
reemplazando S por A. En vez de (26) tenemos ahora 


Ur, Me, 10) = Y Y (—)" Ma No, Mio, Ve, =* 102 <a Ulx,> 


= Y Mm YE ("mM Ma, o, 10) 852, <a Ulb>, (26) 
ab r 


7.| significa que el factor y ha de eliminarse sin cambiar su posición 
r Ly 
entre las otras 4, antes de la eliminación. En vez de (27) tenemos 


To Te, Te, zo .10> a > (—) Ta Na, Ma, --1058 pp,> (27) 
r 


luego, (28) permanece inalterada y, como consecuencia, (29) también. Para 
Ur en el caso de fermiones tenemos la misma forma final (29) que en el 
caso de bosones. De manera análoga, un operador lineal simétrico Vz de 
la forma (30) puede expresarse como 


Vr = Y neTm<abiVicd>a Mo, (85 
abcd 
que es una de las formas de escribir (35). 

£l desarrollo precedente nos muestra que hay una profunda analogía 
entre la teoría de fermiones y la de bosones, necesitándose solamente lige- 
ros cambios en las ecuaciones generales del formalismo al pasar de una 
a otra. 

Sin embargo, hay un desarrollo de la teoría de fermiones que no tiene 
su análogo para bosones. Para fermiones solamente hay las dos alternati- 
vas de ocupación o no ocupación de un estado y hay simetría entre ambas 
alternativas. Puede demostrarse la simetría matemáticamente haciendo 
una transformación que intercambie los conceptos de “ocupado” y “deso- 
cupado”, a saber 


n+ = Mo UN = Ta, 
* — mx pk — ll 
n= NN — 1—Am.. 
Los operadores de creación de las variables sin estrella son los opera- 
dores de aniquilación de las variables con estrella y viceversa. Vemos que 
las variables con estrella satisfacen ahora las mismas condiciones cuánti- 


cas y tienen exactamente las mismas propiedades que las variables sin 
estrella. 
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Si sólo hay unos pocos estados desocupados, un ket standard conve- 
niente para trabajar sería aquel para el cual todos los estados están ocu- 
pados, es decir, el ket [0*> que verifica 


nal0*> —= J0%>. 
y que, por tanto, verifica también 

n* ¡0% =0, 
O sea, 

7* 10%) = 0. 


Los otros estados para el conjunto vendrán representados ahora por 

E 

7* nn"... 10%), 
en la cual las variables que aparecen se refieren a los estados fermiónicos 
sin ocupar a, b, c ... Podemos considerar estos estados fermiónicos desocu- 
pados como huecos entre los estados ocupados y las variables 17% como los 


operadores de creación de tales huecos. Los huecos tienen la misma exis- 
tencia física que las partículas originales y son también fermiones. 


XI 


TEORÍA RELATIVISTA DEL ELECTRÓN e 
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66. Teoría relativista de una partícula 


hd 

La teoría que hemos ido construyendo, hasta ahora, es esencialmente 
una teoría no relativista. Hemos trabajado siempre en un sistema de refe- 
rencia de Lorentz particular y hemos construido la teoría en analogía con 
la dinámica clásica no relativista. Tratemos ahora de hacer invariante la 
teoría frente a las transformaciones de Lorentz, de modo que cumpla con 
el principio de la relatividad restringida. Ello es necesario para poder 
aplicar la teoría a partículas de gran velocidad. No necesitamos que la 
teoría satisfaga la relatividad general, puesto que la relatividad general 
sólo es necesaria cuando se trabaja con la gravitación, y las fuerzas gravi- 
tatorias son totalmente despreciables en los fenómenos atómicos. 

Veamos cómo pueden adaptarse las ideas básicas de la teoría cuántica 
al principio relativista según el cual las cuatro dimensiones del espacio- 
tiempo deben tratarse de igual forma. El principio general de superposi- 
ción de estados tal como se enunció en el capítulo I es un principio rela- 
tivista, puesto que se aplica a “estados” con el significado relativista del 
espacio-tiempo. Sin embargo, el concepto general de observable no encaja 
bien, puesto que un observable puede contener entes físicos en puntos 
muy separados en un mismo instante de tiempo. Por consiguiente, si se 
trabaja con una representación general referida a un conjunto completo 
de observables que conmutan, la teoría no puede mostrar la simetría 
entre espacio y tiempo exigida por la relatividad. En la mecánica cuántica 
relativista debemos contentarnos con una sola representación que goce 
de esta simetría. Existe, sin embargo, la posibilidad de transformarla a otra 
representación referida a otro sistema de referencia de Lorentz particular, 
si ello resulta útil. 

En el problema de una sola partícula, para expresar la simetría entre 
espacio y tiempo, hemos de usar la representación de Schródinger. Ponga- 
MOS X1, X2, X3 en lugar de x, y, z y xo en lugar de ct. La función de onda 
dependiente del tiempo aparece entonces en la forma ¿(xo x, x2 x3) y nos 
proporciona una base para tratar las cuatro x de la misma manera. 





> ”. 
¿ ie A da: “ 
A A A 
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Emplearemos la notación relativista escribiendo las cuatro x como x,, 
(u = 0, 1, 2, 3). Cualquier vector del espacio-tiempo que se transforme 
en una transformación de Lorentz como los cuatro elementos dx, se escri- 
birá a, con un subíndice griego. Podemos subir el índice de acuerdo con 
las reglas 


2 


a = dy a. = —aj,, ad = —4d>, a — —Qz. (1) 


Las a, se llaman componentes contravariantes del vector a, y las a* son las 
componentes covariantes. Dos vectores a, y b, tienen un producto escalar 
invariante bajo las transformaciones de Lorentz igual a 


doo —— (17 bs — da bo — (lz bz = a“b, = a,b". 


Debe entenderse que un índice no numérico repetido indica sumación. 
El tensor fundamental g“” está definido por 


EN E o O e O 
gun — 1, ga na g == dd a 1, q EAN 
: lie 


gu” =0 para y % y. 





Con su ayuda, las reglas (1) que relacionan los componentes covariantes 
y contravariantes se pueden escribir 


¿a A 


al. = ga... 
: y 

En la representación de Schródinger el momento, cuyas componentes 
escribiremos pi, Pp», pa en vez de Pz, Py, Pz es igual al operador 


p, = —ih 0/€x, (== L:2.-3): (3) 


Ahora bien, los cuatro operadores 9/0x, forman las componentes covarian- 
tes de un cuadrivector cuyas componentes contravariantes se escriben 
0/2x%. Para introducir (3) en la teoría relativista hemos de escribirla pri- 
meramente con los índices cambiados 


p, = 1h 0/0x, 
y extenderla entonces a la ecuación completa del cuadrivector 
p, =h0/0x". = ¡* Cp (4) 


Tenemos que introducir, por lo tanto, una nueva variable dinámica po 
igual al operador if 0/2xo. Puesto que combinada con los momentos p, 
forma un cuadrivector, tiene que tener el significado físico de la energía 
de la partícula dividida por c. Podemos seguir el desarrollo de la teoría 
considerando las cuatro p en pie de igualdad con las cuatro x. 

En la teoría del electrón que vamos a desarrollar tendremos que intro- 
ducir un nuevo grado de libertad que da cuenta de un movimiento inte 
del electrón. La función de onda tendrá que incluir, pues, una nueva 
variable además del las cuatro x. 
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67. La ecuación de onda para el electrón 


Consideremos en primer lugar el caso del movimiento de un electrón 
en ausencia de campo electromagnético, es decir, el problema simple de 
una partícula libre ya estudiado en $ 30 con la posible adición de grados 
de libertad internos. El hamiltoniano relativista en mecánica clásica viene 


dado por la ecuación (23) de $ 30 y conduce a la ecuación, de ondas 
-X > Fito Te 441 s 


1 


(p,— (mo + pe pa pa = 0, et ls 


donde las p se interpretan como operadores de acuerdo con (4). La ecua- 
ción (5) si bien tiene en cuenta la relación entre energía y momento que 
exige la relatividad, no es del todo satisfactoria desde el punto de vista 
de la teoría relativista, por la asimetría entre po y las otras p, y debido 
a esto no puede generalizarse de una manera relativista para el caso de 
que exista un campo. Hemos de buscar, por consiguiente, una nueva ecua- 
ción de ondas. 

Si multiplicamos a la izquierda la ecuación de ondas (5) por el operador 


lp, + (mece + pi+ po+ po): obtenemos la ecuación | 
Xx Xx 


po — m*c? — p? — pi — piib = 0, (6) 


que es de una forma invariante relativista y, por consiguiente, es más ade- 
cuada como base de una teoría relativista. La ecuación (6) no es comple- 
tamente equivalente a la ecuación (5) pues si bien toda solución de (5) es 
también solución de (6) el recíproco no es cierto. Sólo las soluciones de (6) 
que pertenecen a valores positivos de po son también soluciones de (5). 

La ecuación de ondas (6) no es de la forma requerida por las leyes 
generales de la teoría cuántica, puesto que es cuadrática en po. En $ 27 
dedujimos mediante argumentos totalmente generales que la ecuación de 
ondas ha de ser lineal en el operador £/8t o po, como se tiene en la ecua- 
ción (7) de esta sección. Buscamos, por lo tanto, una ecuación de ondas 
que sea lineal en po y aproximadamente equivalente a la (6). A fin de que 
esta ecuación se transforme de una manera sencilla bajo una transforma- 
ción de Lorentz, intentaremos modificarla para que sea racional y lineal 
no sólo en po, sino también en p;, pz y pz, y, por lo tanto, de la forma 


[Po — %1 Pr — %2 Pa — Qs Pa — Bib = 0, (7) 


donde las a y 8 son independientes de las p. Puesto que estamos conside- 
rando el caso de que no exista ningún campo, todos los puntos del espacio- 
tiempo han de ser equivalentes; luego, el operador de la ecuación de ondas 
no ha de contener a las x. Por consiguiente, las a y £8 han de independien- 
tes también de las x y, por lo tanto, han de conmutar con las p y las x. 
En consecuencia, describen algún nuevo grado de libertad relacionado 
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con algún movimiento interno del electrón. Veremos más adelante que 
dan cuenta del spin del electrón. 

Multiplicando (7) a la izquierda por el operador (po + % pi + 0% p2 + 
+ az pa + Bj tenemos 

p2— Y [o p? + (a 00 + 00 0) pa po + (0 8 + Baa)po] — BH =0, 


123 
donde Y se refiere a permutaciones circulares de los subíndices 1, 2, 3. 


123 
Esta ecuación coincide con (6) si las « y 8 satisfacen las relaciones 
a ls 01 %o + 00% = 0, 
p2=m0  «afB+g0u =0, 


y las relaciones que se obtienen de éstas al permutar los índices 1, 2, 3. 
Escribiendo 


B = Um MC, 
podemos resumir estas relaciones en la ecuación única 


a % + 0% = Lay (a, b= 1, 2, 3, o bien m). (S) 


Las cuatro a anticonmutan todas entre sí y el cuadrado de cada una de 
ellas es la unidad. 

Por lo tanto, atribuyendo propiedades adecuadas a las « y B, podemos 
hacer la ecuación de ondas (7) equivalente a la (6) en lo que concierne al 
movimiento del electrón como un todo. Supongamos ahora que (7) es la 
ecuación de ondas relativista para el movimiento de un electrón en ausen- 
cia de campo. Esto, sin embargo, origina una dificultad debida al hecho 
que (7), como (6), no es exactamente equivalente a (5), y permite solu- 
ciones correspondientes tanto a valores negativos como a valores positi- 
vos de po. Las primeras no corresponden, por supuesto, a ningún movi- 
miento realmente observable del electrón. Por ahora consideraremos sola- 
mente las soluciones de energía positiva y dejaremos la discusión de las 
de energía negativa para $ 73. 

Podemos obtener fácilmente una representación de las cuatro «. Tienen 
propiedades algebraicas similares a las s introducidas en $ 37, que podían 
representarse por matrices con dos filas y dos columnas. Con matrices de 
dos filas y dos columnas no podemos obtener una representación de más 
de tres cantidades que anticonmuten; necesitamos cuatro filas y cuatro 
columnas para obtener una representación de las cuatro « que anticon- 
mutan. Conviene expresar previamente las a en función de las y y de un 
segundo conjunto de tres variables que anticonmutan px, pz, Pa y que son 
independientes de las « y que conmutan, por tanto, con ellas y cuyos 
cuadrados valen la unidad. Podemos tomar entre otras posibilidades 


% = P101, %o = 102, %z = 103, Am = 3» (9) 
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Las a satisfarán entonces todas las relaciones (8), como puede comprobarse 
fácilmente. Si tomamos ahora una representación con pz y sz diagonales, 
obtendremos el siguiente esquema de matrices: 


si =y/0 1 0 0 9 =¡0-i 0 0 sv=j1 0 0 0 
10.00 ¿0.00 0—1 0 0 
0 0 0 1 0 0 0—:¿ 0 0 1 0 
0.0010 0.0 17 0 0 0 0—1 
ep =/0 0 1 0 pa =y¿0 0O—i O RN A 0 0 0 
0.00 0 1 0 0 0—i¿ 0 1 0 0 
10.00 ¿0.00 0 0—1 0 
0 1.00 0 1 0 0 0 0 0—]1 


Observemos que las p y las s son hermíticas, lo que hace que las « también 
lo sean. 

En correspondencia con las cuatro filas y las cuatro columnas, la fun- 
ción de onda y; ha de contener una variable que tome cuatro valores a fin 
de que las matrices puedan multiplicarse por ella. Otra posibilidad es 
considerar que la función de ondas tiene cuatro componentes, cada una 
función solamente de las cuatro x. Vimos en $ 37 que el spin del electrón 
exige que la función de onda tenga dos componentes. El hecho de que 
nuestra presente teoría dé lugar a cuatro, es debido a que la función de 
ondas tiene doble número de soluciones de las que debería tener, corres- 
pondiendo la mitad de ellas a estados de energía nagtiva. 

Con la ayuda de (9) la ecuación de onda (7) puede escribirse en notación 
vectorial de tres dimensiones 


(Po — p1 (0, Pp) — pamejy = 0. (10) 


Para generalizar esta ecuación al caso de que haya un campo electromag- 
nético, seguimos la regla clásica de substituir py y p por po +€e/c- As y 
p +.e/c. A, donde A, y A son los potenciales escalar y vector del campo 
en el lugar donde se halla el electrón. Así obtenemos la ecuación 


l mar 09 + ZA) emo =0, ; (11) 
que es la ecuación de onda fundamental de la teoría relativista del 
electrón.! | 

Las cuatro componentes de 4 en (10) u (11) han de representarse escri- 
tas una debajo de otra, formando una matriz de una sola columna. Las 
matrices cuadradas p y 9 quedan multiplicadas entonces por la matriz de 
una sola columna y según la regla ordinaria de multiplicación de matri- 


A 


+ N. de T.: Esta ecuación se conoce con el nombre de ecuación de Dirac 
para el electrón, en honor a su descubridor. 





is 
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ces, siendo el producto otra matriz de una sola columna. La función de 
onda imaginaria conjugada que representa un bra debe representarse 
con sus cuatro componentes una al lado de otra formando una matriz de 
una sola fila, que puede multiplicarse a la derecha por una matriz cuadrada 
para dar otra matriz de una sola fila. A esta función de onda imaginaria 
conjugada, representada por una matriz de una sola fila la designare- 
mos 4t, donde el signo * indica la traspuesta de una matriz, es decir, el 
resultado de intercambiar filas por columnas. La imaginaria conjugada 
de la ecuación (11) será entonces 


f e e 
phd (a p A — 0s mo | = 0, (19) 
con los operadores p actuando a la izquierda. Los operadores de deriva- 


ción actuando a la izquierda han de interpretarse de acuerdo con (24) 
de $ 22. 


68. Invariancia bajo una transformación de Lorentz 


Antes de pasar a discutir las consecuencias físicas de la ecuación de 
onda (11) o (12) vamos a comprobar previamente que nuestra teoría es 
invariante bajo las transformaciones de Lorentz, o más exactamente, que 
los resultados físicos a que conduce la teoría son independientes del sistema 
de referencia de Lorentz considerado. Esto no se desprende inmediata- 
mente de la forma de la ecuación de onda (11). Hemos de comprobar que, 
al escribir la ecuación de onda en un sistema de Lorentz distinto, las 
soluciones de la nueva ecuación de onda pueden ponerse en correspon- 
dencia biyectiva con las de la primitiva de tal modo que las soluciones 
correspondientes representen el mismo estado. Para cada sistema de Lo- 
rentz, el cuadrado del módulo de la función de onda, que se obtiene 
sumando los de las cuatro componentes, tiene que ser igual a la probabi- 
lidad por unidad de volumen de que el electrón esté en un cierto lugar 
de esta representación. Podemos denominarla densidad de probabilidad. 
Sus valores, calculados en diferentes sistemas de Lorentz para funciones 
de onda que representen el mismo estado, han de estar relacionados como 
las componentes temporales de un cuadrivector en estos sistemas. Además 
la divergencia cuadridimensional de este cuadrivector ha de anularse, sig- 
nificando con ello conservación del electrón, es decir, que el electrón no 
puede parecer o desaparecer en un volumen sin pasar por su contorno. 

Para abreviar es conveniente introducir el símbolo «y = 1 y suponer 
que los subíndices de las cuatro a, (4 = 0, 1, 2, 3) pueden subirse de 
acuerdo con las reglas (1), a pesar de que estas cuatro 4 no formen las 


18. — CUÁNTICA 
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componentes de ningún cuadrivector. Podemos escribir ahora la ecuación 
de onda (11) 


lar(p, +€/c-A,) — Un mesyp = 0. (13) 
Las cuatro a* verifican 
AZ 0 Y 0% a — 28%” 0 (14) 


con las g*” definidas en (2), como puede comprobarse tomando separada- 
mente los casos en que p y v son ambas 0, cuando una de ellas es 0, y 
cuando ninguna lo es. 

Apliquemos una transformación de Lorentz infinitesimal y distigamos 
mediante una estrella las cantidades referidas al nuevo sistema de refe- 
rencia. Las componentes del cuadrivector p, se transformarán de acuerdo 
con ecuaciones del tipo 


pt =p, +4, p,, (15) 


donde las a,” son infinitésimos de primer orden. Despreciaremos las can- 
tidades cuadráticas en las a ya que son de segundo orden. La condición 
para que una transformación sea de Lorentz es que 


Papo* = pp”, 
que da 
a,'pyp" +p,0"p, =0, 
y por lo tanto 
ar” +a" =0, (16) 


Las componentes de A, se transformarán de acuerdo con la misma ley, y 
así tenemos 


p, +e/c.A, = pi +e/c.At—a *(p*+e/c.A*), 
La ecuación de onda (13) se transforma pues en 
Lar — ada, p* + e/c. AF) — A mejg = O. (17) 


Definimos ahora 
M = 34,0 %ma”. (18) 
Luego, según (14) 
24m MM amo = 34, (0 0ma” - 0 4ma")amá” — 
— PAm(A Ima” + 2 da) 
= 30,,(8"*%" —a*g"") 


AZ] _—a*a? 
== aq, 





a 
A A 
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con la ayuda de (16). De aquí 
a(1 + %m M) = (1+ Mam)a" — a, a”). (19) 
Multiplicando (17) por (1 + Mam) a la izquierda, obtenemos 
i0(1 + dm Mp? + e/c . AF) — (09m + Mjmcjg = 0. 


Y si ponemos 


(1 + Am My = y*, (20) 


lar (pr + e/c. Af) — dm mejy* = O. (21) 


resulta 


que es de la misma forma que (13) en las variables con estrella p*, 
AF y*, y muestra que (13) es invariante bajo una transformación de 
Lorentz infinitesimal, siempre y cuando y esté sujeta a la transformación 
correcta dada por (20). Mediante transformaciones de Lorentz infinitesi- 
males podemos construir una transformación de Lorentz finita, luego, la 
ecuación de onda (13) también es invariante bajo una transformación de 
Lorentz finita. Obsérvese que las matrices «* quedan totalmente inalte- 
radas. | | 

La invariancia que hemos comprobado significa que las soluciones Y 
de la primitiva ecuación de onda (13) están en correspondencia biyectiva 
con las soluciones 4* de la nueva ecuación de onda (21), estando relacio- 
nadas las soluciones correspondientes por (20). Vamos a suponer que las 
soluciones correspondientes representan el mismo estado físico. Hemos 
de comprobar ahora que las interpretaciones físicas de las soluciones 
correspondientes, referidas a sus respectivos sistemas de referencia de 
Lorentz, concuerdan. Esto exige que 44 dé la densidad de probabilidad 
referida al sistema primitivo y 4+*t4* la densidad de probabilidad referida 
al nuevo sistema. Examinemos la relación entre estas dos cantidades. ¿Jt% 
es lo mismo que ¿Hay que forma una de las cuatro cantidades ¿Jas 
que consideraremos conjuntamente. | 

Las ecuaciones (18) y (16) muestran que M es imaginario puro. Luego, 
la conjugada imaginaria de la ecuación (20) es 


Fe = F(L—M am), 
De donde 
peta = ¿(1 — M omja*(1 + dm My 
= $101 —M dam (1 + M ame” — a, Ma” js 
según (19). Esto se reduce con la ayuda de (16), a 


pique — fiar — a ads 
= Fary + 02 Pa 


e EA 


om e Xy 
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Í Pr ] d | a . 
4 o f + e A ) UN ex e € f ae : 


j 


Si bajamos el índice y obtenemos una ecuación de la misma forma que (15), 
lo que muestra que las cuatro cantidades YPta 4 se transforman como las 
componentes contravariantes de un cuadrivector. Luego, Y t4 se transforma 
como la componente temporal de un cuadrivector, que es la ley de trans- 
formación correcta de la densidad de probabilidad. Si multiplicamos por c 
las componentes espaciales del cuadrivector, o sea, las Yta,4, obtenemos 
la corriente de probabilidad o probabilidad de que el electrón atraviese la 
unidad de área por unidad de tiempo. 
Observemos que ¿tamb es invariante, puesto que 


Aa? = PY -— M dm) %m (1 + %n My 
— amb. | 


Hemos de verificar finalmente la ley de conservación, es decir, que la 
divergencia 
O 


> Pb) (22) 





es nula. Para probarlo multiplicaremos la ecuación (13) por y a la iz- 
quierda. El resultado es 


pra 1 ad + Ad) — Pan mej =-0, 





La ecuación imaginaria conjugada es 





OR e : 
(— xn +94,)a ¿ — bam. mep = 0. 


Restando y dividiendo por if, obtenemos 


0 opt 
E 


Ox" Ox" 








ptas ar = 0, 
que expresa precisamente la anulación de (22). Completamos de esta 
manera la prueba de que nuestra teoría da resultados concordantes en 
cualquier sistema de referencia a que se aplique. 


69, Movimiento de un electrón libre 


Es interesante considerar el movimiento de un electrón libre en la 
imagen de Heisenberg“de acuerdo con la teoría anterior y estudiar las 
ecuaciones del movimiento de Heisenberg. Estas ecuaciones del movi- 
miento pueden integrarse exactamente, como hizo por primera vez Schró- 
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dinger.* Omitiremos para abreviar el subíndice t que según la notación 
de $ 28 tendríamos que añadir a las variables dinámicas que varían con 
el tiempo en la imagen de Heisenberg. 

Hemos de tomar como hamiltoniano la expresión que se obtiene para 
cpo al igualar a cero el operador que actúa sobre 4 en (10), es decir, 


H =Cpi(G, p) + pame? — c(a, p) + es mc”. a el E 
Vemos inmediatamente que el momento conmuta con H y que, por lo 


tanto, es una constante del movimiento. Además la componente x, de la 


velocidad es 
Xa — [x,, H] —= (CA. (24) 


Este resultado es bastante sorprendente, pues es una relación totalmente 
diferente entre velocidad y momento de la que se tiene en mecánica 
clásica. Sin embargo, está relacionada con la expresión yYicawb de una 
componente de la corriente de probabilidad. La í, dada por (24) tiene 
los autovalores + c correspondientes a los autovalores +1 de as. Como 
Ya y Xa son análogas, podemos concluir que la medición de una componen- 
te de la velocidad de un electrón da con certeza el resultado + c. Puede 
verse fácilmente que esta conclusión vale también cuando existe campo. : 

Como en la práctica se observa que los electrones tienen velocidades 
considerablemente menores que la de la luz, podría parecer que tenemos 
una contradicción con la experiencia. Sin embargo, la contradicción no es 
real puesto que la velocidad teórica de la conclusión anterior es la velo- 
cidad en un instante, mientras que las velocidades observadas son siempre 
promedios de velocidad durante intervalos de tiempo apreciables. Exami- 
nando con más detalle las ecuaciones del movimiento encontraremos que 
la velocidad no es en absoluto constante, sino que oscila rápidamente alre- 
dedor de un valor medio que concuerda con el valor observado. 

Puede justificarse fácilmente que una medida de una componente de 
la velocidad ha de conducir en una teoría relativista al resultado = c, 
considerando simplemente el principio de incertidumbre de $ 24, Para 
medir la velocidad hemos de medir la posición en dos instantes de tiempo 
ligeramente diferentes y dividir entonces el cambio de posición por el 
intervalo de tiempo. (No tendría valor alguno medir el momento y apli- 
car una fórmula, puesto que la relación ordinaria entre velocidad y mo- 
mento no es válida.) Para que la velocidad que medimos pueda aproxi- 
marse a la velocidad instantánea, el intervalo de tiempo entre las dos 
medidas de la posición ha de ser muy corto y, por lo tanto, las medidas 
muy precisas. La gran precisión con que debe conocerse la posición del 
electrón durante el intervalo de tiempo, ha de dar lugar, según el princi- 
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pio de incertidumbre, a una indeterminación casi completa en su momento. 
Esto significa que casi todos los valores del momento son igualmente pro- 
bables, luego, el momento es con casi toda probabilidad infinito. Un valor 
infinito de una componente del momento corresponde al valor + c de la 
componente de la velocidad correspondiente. 

Examinemos ahora cómo varía la velocidad del electrón con el tiempo. 


Tenemos 
iñhdA; = a1 H ES Ha;. 


Como a, anticonmuta con todos los términos de H excepto Ca1p1, se tendrá 


al = Ha, > aiCa1Pr + C41P1%1 = 2Cp,, 
de donde 


¡hos == 2a1H — 2cp,, 


(25) 
== — 2Ha; 0 2Cp,. 


Como H y p, son constantes, de la primera ecuación (25) se deduce que 
RA; o. 24H. (26) 


Esta ecuación diferencial en «, puede integrarse inmediatamente obte- 


niéndose 
dy = Qe uñt/a, (27) 


donde á; es una constante, igual al valor de 4, para t = 0. El factor 
e”tHt/f tiene que colocarse a la derecha del factor á; en (27) porque la H 
aparece a la derecha de «,*en (26). La segunda ecuación (25) conduce 
del mismo modo al resultado 


O — euiBt/h y o, 


Podemos completar ahora fácilmente la integración de la ecuación de mo- 
vimiento en x,. De (27) y de la primera ecuación (25) 


a = 3h e HRET4 Ccp HA, (28) 
de donde la integral respecto al tiempo de la ecuación (24) es 
a = —1ich?4 e +HMAE234 pH 4 + a, (29) 


siendo x«, una constante. 

Vemos en (28) que la componente x, de la velocidad, o sea Ca,, consta 
de dos partes; una parte constante c“p¡H”?, relacionada con el momento 
por la fórmula clásica relativista, y una parte oscilatoria 


de alta frecuencia 2H/h, que vale como mínimo 2mc*/h. En una medi- 
ción práctica de la velocidad sólo se observaría la parte constante, pues 


70. EXISTENCIA DEL SPIN 279 


la medición sólo puede determinar la velocidad promedio durante un 
intervalo de tiempo mucho menor que h/2me?. La parte oscilatoria hace 
que el valor instantáneo de %, tenga los autovalores + c. La parte oscila- 
toria de x, es pequeña; según (29) vale 

— 1ch?0e-20iH:/2nH-2 —= Jichi(a, —cpH 29H, 
que es del orden de magnitud de fA/mc, ya que ad 1) es del 
orden de magnitud unidad. 


70. Existencia del spin 


Vimos en $ 67 que la ecuación de onda correcta para el electrón en 
ausencia de un campo electromagnético, es decir, la ecuación (7) o (10) es 
equivalente a la ecuación de onda (6) sugerida por analogía con la teoría 
clásica. Esta equivalencia deja de ser válida cuando hay un campo. La 
ecuación de onda que puede esperarse en este caso por analogía con la 
teoría clásica es 


e 2 e 2 | 
(Za) —(orta) meteo 00 


en la cual el operador es precisamente el hamiltoniano relativista clásico. 
Si, para obtener a partir de (11) una expresión que se parezca a (30) tanto 
como sea posible, la multiplicamos a la izquierda por el factor 


y , 
po += Ao + 019. p+2A)+ ps Me, 


obtenemos 


l(m+La4.) (9 PERA) —mec—« 


|(m+a.)/0 p+2a)o p+A)[p +80) | lu =0. (31) 


Empleemos ahora la fórmula general, válida: para dos vectores tridi- 
mensionales B y C cualesquiera que conmuten con 6, 


(a, Bla, C) = 2 lo? B,C, +0, 02 B, C2 +02 01 B2C5), 


donde la sumación está extendida a las permutaciones circulares de los 
subíndices 1, 2, 3, y que también puede escribirse 


(a, Bla, C) =(B, O) +i Y os(B, Co —B2C)) 


123 


= (B, C) + 1(6, Bx C). (32) 
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Tomando B — C — p+ e/c.A, y teniendo en cuenta que 
e e e 
(e+Za)]x(9+2a) = 2 ipxa+Axm) 
= —ihe/c.rot A — —ihe/c.H, 


donde 4 es el campo magnético, resulta 


2 2 h , 
(e. »+2a) =(P+zA) +=(0, Hp. (33) 


Asimismo resulta 
C : e 
a) ptas) 
C C 





(m+ La (o p+ ZA) (o p+ 


e 
== e (a, prA — Apo + Aop — pAo) 


— el e 4.) == —i—/(0, €), 
C c 0t Cc 


donde € es el campo eléctrico. Por lo tanto, (31) da 


e E 2 

(+ Za)= (P+s a)- m- 0— o, FW (a, Sy = 0. 

(34) 

Esta ecuación difiere de (30) en que tiene dos términos más en el operador. 

Estos términos extra implican ciertos efectos físicos nuevos, pero como 
aquéllos no son reales no se prestan a una interpretación física directa. 

Para comprender los hechos físicos que se derivan de la diferencia 

entre (34) y (30) es mejor emplear la representación de Heisenberg, que 

es siempre la más adecuada para establecer comparaciones entre la mecá- 

nica clásica y la cuántica. Las ecuaciones de Heisenberg del movimiento 

están determinadas por el hamiltoniano 


/ C 
H=— CAs =+ CO ( Cc, p + =— a) 3 23 mao, (35) 
C 


que se obtiene por generalización de (23) para el caso en que hay campo. 
La ecuación (35) da, con la ayuda de (33), 


P H e 2 e 12 
— + — Ay a 0, pE—A | + game | 
C C | Y ( 

8 


| e 
= (a PEA) + mc? 


ey? , he 
=(p+ha Lance — Ne Ele ] (36); paa 
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4) 
Aquí aparece la parte real de los términos adicionales de (34) sin su parte 
imaginaria. Para un electrón que se mueva lentamente (es decir, con mo- 
mento pequeño), podemos esperar que las ecuaciones del movimiento de 
Heisenberg estén determinadas por un hamiltoniano de la forma mc* + Ha, 
donde H, es pequeño en comparación con me?, Sustituyendo en (36) H 
por mc? + H, y despreciando H? y otros términos que contienen c”?, obte- 
nemos, dividiendo por 2m 


1 2 h 
Mi +edo ==, (P+ ÍA) + (o, 48). (37) 


El hamiltoniano H, dado por (37) es el mismo que el hamiltoniano clásico 
para un electrón lento a excepción del último.término 


he 
| 2mc 0 
Este término puede considerarse como una energía potencial adicional de 
un electrón lento en la teoría cuántica y puede interpretarse apio 
de que el electrón tiene un momento magnético —he/2mc .e. Este mo- 
mento magnético es el que postulamos en $$ 41 y 47 al estudiar el efecto : 
Zeeman y está de acuerdo con la experiencia. 

El momento angular de spin no origina ninguna energía potencial y 
por ello no aparece en el resultado del cálculo precedente. La manera 
más simple de mostrar la existencia del momento angular de spin es consi- 
derar el caso del movimiento de un electrón libre o de un electrón en un 
campo de fuerzas central y determinar las integrales del momento angular. 
Para ello hemos de emplear el hamiltoniano (23), o el hamiltoniano (35) 
tomando A =— 0 y Ay función del radio r, es decir, 


H = —eAo(r) + cpa(o, p) + ea me”, (38) 


y obtener las ecuaciones del movimiento de Heisenberg para el momento 
angular. Con ambos hamiltonianos se obtiene una variación respecto al 
tiempo de la componente x, del momento angular orbital m, = x2p3 — 
— XgP2, que vale 
ihm, = m,H — Em, 

= coiim,(o, p)— (0, p)m,) 

= coo, mp — pm) 

— ihcp11o2P3 — 53P2). 


en cuya deducción hemos empleado las relaciones de conmutación obte- 
nidas en $ 35. 

Por lo tanto, m, +0 de donde el momento angular orbital no es una 
constante del movimiento. Este resultado era b esperar a la vista de la 
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ecuación del movimiento integrada (29), puesto que la parte oscilatoria 
del movimiento que aparece en ésta debe dar lugar a un término oscila- 
torio en el momento angular. 

Por otro lado, teniendo en cuenta las ecuaciones (51) de $ 37, resulta 


iho, NS 01H — Ho, 

corior(6, p) e (a, p)01) 
—= Cpi(5,8 — Go, p) 

e Zicp1Í53P2 2 02P3) 


| 


Luego, 
mi + ¿ño = 0, 


y en consecuencia, el vector m + 3ág es una constante del movimiento. 
Puede interpretarse este resultado diciendo que el electrón tiene un mo- 
mento angular de spin ¿ha, que para obtener una constante del movi- 
miento ha de añadirse al momento angular orbital m. El momento angu- 
lar de spin podía haberse obtenido también a partir de los operadores de 
rotación para los estados de spin, según el método general de $ 35. 
El mismo vector a fija las direcciones del momento magnético de spin 
y del momento angular de spin. Si un electrón en un cierto estado de 
spin tiene un momento angular de spin 3A en una dirección particular, 
tendrá a su vez un momento magnético — eh/2mc en la misma dirección. 
Hemos obtenido el valor 4% para el spin del electrón mediante un ar- 
gumento basado únicamente en principios generales de la teoría cuántica 
y de la relatividad. Podríamos aplicar el mismo argumento a otras partícu- 
las elementales y llegaríamos a la misma conclusión de que su momento 
angular de spin es medio cuanto. Esto sería satisfactorio para el protón 
y el neutrón, pero hay algunas partículas elementales (por ejemplo el 
fotón y ciertos tipos de mesones) cuyos spines sabemos experimental- 
mente que son distintos de 3%f; he aquí, pues, una discrepancia entre 
nuestra teoría y la experiencia. 
¿ La respuesta ha de encontrarse en una hipótesis que está implícita en 
nuestro trabajo. El argumento sólo es válido si la posición de la partícula 
es un observable. Si se verifica esta hipótesis, la partícula ha de tener un 
momento angular de spin de medio cuanto. Para las partículas que tienen 
un spin diferente no debe verificarse la hipótesis, y las variables dinámi- 
CAS X1, Xa, Xg, que puedan introducirse para describir la posición de la 
partícula, según nuestra teoría general no serán observables. Para tales | 
«partículas no existe una representación de Schródinger auténtica. Sería ' 
posible introducir una cuasi función de onda relatividé las variables di- | 
námicas Xy, Xa, X3 pero no tendría la interpretación física correcta de una 
función de onda y el cuadrado de su módulo no representaría, por tanto, 
¡la densidad de probabilidad. Para tales partículas existe una representación / 
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. de momentos que es suficiente para casos prácticos. 
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71. Transformación a variables polares 


Para el estudio posterior del movimiento de un electrón en un campo 
de fuerzas central con el hamiltoniano (38), es conveniente hacer una 
transformación a coordenadas polares, como hicimos en $ 38 en el caso no 
relativista. Podemos introducir r y p, igual que allí, pero en vez de k, 
magnitud del momento angular orbital m, que ya no es una constante del 
movimiento, hémos de emplear ahora la magnitud del movimiento angu- 
lar total M —*m + ¿ha. Pongamos 


ph? = M24 M2 4 M24 4h. (39) 


los autovalores de m; son múltiples enteros de h, los de ha? son 
+ 3% y, por consiguiente, los de Mz han -de ser múltiplos impares semi- 
enteros de h. De la teoría de $ 36 se deduce que los autovalores de [¡| han 
de ser enteros positivos. 

Si en la fórmula (32) tomamos B — C —m, obtenemos 


(o, m)? — m* + i(a, m x m) 
= m?—Á(o, m) 
(m + 3%0) —2h(a, m) —¿%A?. 


| 


De donde 
(o, m) - Ah)? = M?+ 4%2. 


Luego, (a, m) +% es una cantidad cuyo cuadrado es M? + 1%f?, y de 
acuerdo con la ecuación (39), podríamos definir ¿h como (a, m) + h. Ésta 
no sería, sin embargo, la definición más conveniente de j, pues queremos 
que j sea una constante del movimiento y (a, m) + A no lo es. Aplican- 
do (32) tenemos 


(a, m)(s, p) = i(a, m X p) 
AS 
(a, pla, m) = í(o, p Xx m), 
de modo que 
(a, mj(a, p) + (9, pla, m) = i Y 5,[M2p3 — Map2 + PaMz — Pa3Mo) 


123 


= 1 Ss 91 . 2ihp1 — — 2h(0, p), 


123 


(a, m) + ñj(a, p) + (a, p)t(a, m) + Aj = 0. 


Por lo tanto, (a, m) + Á anticonmuta con uno de los términos, en la expre- 
sión (38) de H, a saber, el término cp,(6,. p), y conmuta con los otros dos. 
De ello se sigue que psí(a, m) + A) conmuta con los tres términos de H 
y que, por lo tanto, es una constante del movimiento. Además, el cuadrado 


2 % á 
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de psía, m) + ñ) es también M? + 4%?. Podemos tomar, por consiguiente, 
¡ñh = pgsllo, m) + h,, (40) 


que es una definición racional y conveniente de j, en concordancia con (39), 
y hace de ¡ una constante del movimiento. Los autovalores de esta ¿, son 
todos los enteros positivos y negativos menos el cero. 

Mediante una nueva aplicación de (32) obtenemos, con la ayuda de (40) 
y también de la ecuación (58) de $ 38 


(a, x)(0, p) = (x, p) + 1(6, m) 


— tp, + ipajhñ —ih, (41) 
Introducimos el operador lineal e definido por 
re = pila, x). (42) 
Como r conmuta con p, y con (a, x) ha de conmutar con e. Tenemos pues 
1222 — [poja, x)1? = (0, x)? = x* = r, 
O sea, 
ss =.L 


Ahora bien, p,(6, p) conmuta con ¡ y como en lo que respecta al momento 
angular hay simetría entre x y p, pi(9, x) ha de conmutar también con j. 
Luego, e conmuta con jf. Además e ha de conmutar con p,, puesto que 
tenemos 


(a, x)(x, p) — (x, pa, x) — (a, x(x, p) — (x, p)x) — ih(o, x), 
que da 


| rep, — rpyre = ihre, 
o bien 
12ep, — 1p,e = 0. 


De (41) y (42) obtenemos 
repi(O, p) = Tp, + ipsjh — ih, 
plo, p) = ep, —ih/r) +iepojh/r. 
Con lo que (38) da 
H/c = —e/Jc. As + elp, —ih/r) + iepajh/r + pa me. 


O sea, 


que expresa el hamiltoniano en función de las variables polares. Debemos 
observar que e y p3 conmutan con todas las demás variables que figuran 
en H, y anticonmutan entre sí. Esto significa que podemos tomar una 
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representación con pa diagonal en la cual e y pz están representados respec- 
tivamente por las matrices 
1 0 (43) 
0 —1 | 


0  —i 
í 0 
Si r es también diagonal en la representación, el representante <r'pz|> de 


un ket tendrá dos componentes <r”, 1]> = ya[r”) y <r, —11> = yo(r”), rela- 
tivas a las dos filas y columnas de las matrices (43). 


72. Estructura fina de los niveles de energía del hidrógeno 


Consideremos ahora el caso del átomo de hidrógeno, para el cual 
Ay = e/r, y calculemos sus niveles de energía dados por los autovalores 
_H' de H. La ecuación (H* — H)|> = 0 que define dichos autovalores, escrita 
en función de sus representantes en la representación considerada ante- 
riormente en la que e y ez están representados por las matrices (43), da 
lugar a las ecuaciones 


me (LA 
)u.+ 8 7 eo + Ep mapa 


C cr 


| 
> 


Hyg e 4 e ste 
+5) E )». q a + ma) = 00. 


Cc r 


Si ponemos 


h h 
o. as, ——— oros, 7 do, a 44 
mc — H'/c mc + H/c ( ) 
estas ecuaciones se reducen a a 





1 a NY O +1 
(A+) —(5+ E )í =0, 


1 na a O ¡j—1 4 

A» y 4» a or r ba A 
donde « = e?/fc, que es un número pequeño. Vamos a resolver estas 
ecuaciones por un método semejante al que empleábamos para la ecua- 
ción (73) de $ 39. 


"Pongamos 


(45) 





E a ES E by = rie r/tg, * (46) 
introduciendo las dos nuevas funciones de r, f y g, siendo 


a = (asas)? —= h(m*c? — H?/c?)+, (47) 
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Las ecuaciones (45) dan 
1 a 14) 1 
e aa+r)e-0 
(48) 


as 0 1 j 
ES Jl a r OS 


Vamos a ensayar una solución para f y g de la forma de una serie de po- 
tencias 


PF= 30 E E (49) 


donde los valores consecutivos de s difieren en una unidad si bien no 
exigimos que sean enteros. Sustituyendo estas expresiones de f y g en (48) 
y separando los coeficientes de r**, obtenemos 


c ./a —ac — (s + po +0, /a = O, | 
, , . . á (50) 
e” 44, ea (s — pe. + co Ja == | 


Multiplicando la primera de estas ecuaciones por a y la segunda por a; y 
restando, eliminamos ce. y C._,, puesto que según (47) a/a, = a/a. 
Nos queda 


[as — as —¡)]0s + [asa + als + )Jcs = 0, (51) 


relación que liga las c y las c”. 

La condición límite para r = O exige que tha y rb, tiendan a cero 
cuando 7 >0, luego, según (46), f y g tienden a cero para r >0. Por lo 
tanto, las series (49) han de terminar por el lado de las s pequeñas. Si so 
es el valor mínimo de s para el cual €, y c” no son ambas nulas, de (50) 


resulta, poniendo s = So yC,_, = c” => 0, 
ac + (s, + pc = 0: 
E a (52) 
AC, (s, — e, = 0, 
que da 
a ==. +. 


Como la condición límite exige que el valor mínimo de s sea mayor que 
cero, hemos de tomar 


So = + V (pa). 


Para estudiar la convergencia de las series (49) hemos de hallar la 
relación C,/c,-1 para s grande. La ecuación (51) y la segunda ecuación (50) 
da aproximadamente, cuando s es grande, 


d.C, = ac! 
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SC = Cai /0 + Cons / Oo, 
De donde 
c/t. =2/48: 
Las series (49) convergerán, por lo tanto, como 
LIN 


o e””/*, Este resultado es análogo al obtenido en $ 39 y nos permite inferir, 
igual que allí, que para a imaginario puro, o sea, según (47), para H' > me?, 
son posibles todos los valores de H”, mientras que para H” < me?, eligiendo 
a positivo, resulta entonces que sólo son posibles los valores de H” para 
los cuales las series (49) terminan por el lado de las s grandes. 

Si las series (49) terminan con los términos €, y CO Sea Si Cgy1 = 
= C4.1 = 0, sustituyendo s por s + 1 en (50) obtendremos 


Ca/41 +c/a = O, 
0/42 + C¿/a = 0. (53) . 


Estas dos ecuaciones según (47) son equivalentes. Combinadas en (51) dan 
a, [a — ay(s —j)] = ala,ya + als + 7)), 
que se reduce a 
24,498 = a(a, — d»)a, 


o con la ayuda de (44), 


Elevando al cuadrado y empleando (47) obtenemos 


s*(m?c? — H?/c?) = e2H?/0?. 


H' aN Ty 
-= A | 
mc? se 


La s de esta ecuación, que determina el último término de las series, ha de 
superar a sy en algún entero no menor que cero. Llamando n a dicho ente- 
ro, tenemos 


De donde 





s=n+V (Pa) 
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y por consiguiente, 


, 2 -4 
— 14 oi | (54) 
me in + Y (P — 07), 

Esta fórmula nos da los niveles de energía discretos del espectro del 
hidrógeno, y fue obtenida por primera vez por Sommerfeld trabajando 
con la teoría de las órbitas de Bohr. Contiene dos números cuánticos n y j, 
pero, por ser a? muy pequeño, la energía depende casi exclusivamente 
de n + |j. Los valores de n y de |j| que dan el mismo valor de n + ijl, 
dan lugar a un conjunto de niveles de energía situados muy cerca unos de 
otros y, salvo el término constante mc?, también muy cerca del nivel de 
energía dado por la fórmula no relativista (80) de $ 39 para s = n+ ljl. 

Hemos utilizado las ecuaciones (53) combinadas con (51), con lo cual 
no hemos empleado a fondo (53), puesto que los coeficientes de ca y C, en 
(51) pueden ser ambos nulos. En este caso, multiplicando el primer coefi- 
ciente por a, y el segundo por a y sumando, obtenemos 


a(ay ld do)a + 24,42] =:0 


Luego, ¡ ha de ser negativo en este caso, Con ayuda de (44) y (47) obte- 
nemos además 


2 a 4 2mca 2mc 


q a a hh (mic—H?/c)h 
o sea, 


Como H' ha de ser positivo, llegamos a 


H' 2 __y2 
HO VEA) (55) 
me? r | 
que es el valor de H' dado por (54) para n = 0. El caso n = 0 y ¡ nega- 
tivo necesita, por lo tanto, otro examen para ver si se cumplen las condi- 
ciones (93). 
Con n = 0 el valor máximo de s es igual al mínimo, luego, las ecua- 
ciones (53) con so en lugar de s tienen que concordar con (52). Ahora bien, 


aplicando (44) y (47), (55) da 
cl Mbt VPF — a) ) 1_ mea 
a ñ il a ñ Ii 
luego, la primera ecuación (53), poniendo sy en lugar de s, da 
e MVP) HA a =0, 
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que concuerda con la segunda ecuación (52) solamente si j es positivo. 
Concluimos, pues que para n = 0, ¡ ha de ser entero positivo, mientras 
que para los otros valores de n, ¿ puede tomar todos los valores enteros 
distintos de cero. 


13. Teoría del positrón 

En $ 67 decíamos que la ecuación de onda para el electrón admite 
doble número de soluciones de las que debería admitir; la mitad de ellas 
correspondían a estados con valores negativos de la energía cinética 
CPo + €4Ap. Esta dificultad se introdujo desde el momento en que pasamos 
de la ecuación (5) a: la ecuación (6), y es inherente a toda teoría relativista. 
Aparece también en teoría relativista clásica, pero allí no constituye una 
dificultad seria debido a que todas las variables dinámicas clásicas varían 
con continuidad, y si la energía cinética Cpo +eAo es inicialmente positiva 
(en cuyo caso tiene que ser mayor o igual que mc?) no puede ser negativa 
en un instante posterior (en cuyo caso tendría que ser menor o igual que 
— mc”). En cambio, en la teoría cuántica pueden presentarse transiciones 
discontinuas, y si el electrón están inicialmente en un estado de energía ci- 
nética positiva puede hacer una transición y, pasar a un estado de energía 
cinética negativa. Ya no es posible, por lo tanto, ignorar sencillamente los 
estados de energía negativa como en teoría clásica. 

Examinemos más detenidamente las soluciones de energía negativa de 
la ecuación 


| e e 
(+24) (mita) — 
| Cc Cc 
e e l 
— a. Po+ As) — %% (mo+ As ) —anmo | 4 == 0 (56) 


Para ello es conveniente usar una representación de las a en la que todos 
los elementos de las matrices que representan a, %z y %z sean reales y 
todos los que representan %n sean imaginarios puros o cero. Puede obte- 
nerse una representación de este tipo, por ejemplo, a partir de la de $ 67 
intercambiando las expresiones de a, y %m en (9). Si expresamos (56) como 
una ecuación matricial en esta representación y ponemos — i en lugar de i, 
recordando la i de (4), obtendremos 


(ret) (era) 
C t 


E € € 
— 0 | 9 G 4) 20 [ — po + LA ) e amo | H =0. (57) 


19. — CUÁNTICA 
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Por lo tanto, cada solución 4 de la ecuación de ondas (56) tiene por com- 
pleja conjugada Y una solución de la ecuación de ondas (57). Además si 
la solución y de (56) pertenece a un valor negativo de cp, + eA, la corres- 
pondiente solución 4 de (57) pertenecerá a un valor positivo de Cpo + €As. 
Pero el operador de (57) es precisamente el que obtendría sustituyendo 
e por —e en el operador de (56). De ello se deduce que cada solución 
de energía negativa de (56) es la compleja conjugada de una solución de 
energía positiva de la ecuación de onda que se obtiene de (56) sustitu- 
yendo e por —e, solución que representa un electrón de carga + e (en 
vez de —e como teníamos hasta ahora) moviéndose a través del campo 
electromagnético dado. Por lo tanto, las soluciones extra de (56) están rela- 
cionadas con el movimiento de un electrón de carga + €. (Es imposible 
separar definidamente las soluciones de (56) para un campo electromag- 
nético general en soluciones referidas a valores positivos y a valores nega- 
tivos de Cpo + €Ap, puesto que tal separación implicaría que no pudieran 
tener lugar transiciones de un tipo de soluciones a otro. La discusión pre- 
cedente es solamente aproximada, y sólo se aplica cuando es aproximada- 
mente posible tal separación.) 

Deducimos así que las soluciones de (56) que pertenecen a una energía 
negativa se refieren al movimiento de un nuevo tipo de partícula de masa 
igual a la del electrón y de carga opuesta. Tales partículas se han obser- 
vado experimentalmente y se llaman positrones. Sin embargo, no podemos 
afirmar simplemente que las soluciones de energía negativa representen po- 
sitrones, puesto que con ello todas las relaciones dinámicas serían incorrec- 
tas. Por ejemplo, es evidente que un positrón no tiene una energía cinética 
negativa. Así pues, hemos de establecer la teoría del positrón sobre una 
base algo distinta. Supongamos que casi todos los estados de energía nega- 
tiva están ocupados, con un electrón en cada estado de acuerdo con el prin- 
cipio de exclusión de Pauli. Un estado de energía negativa desocupado, 
aparecerá entonces como algo con energía positiva, puesto que para hacerlo 
desaparecer, es decir, para llenarlo, tendríamos que añadir un electrón de 
energía negativa. Hacemos la hipótesis de que estos estados desocupados 
de energía negativa son los positrones. 

Estas hipótesis exigen que haya una distribución de electrones de densi- 
dad infinita en cualquier lugar del espacio. Un vacío perfecto es una 
región donde todos los estados de energía positiva están desocupados y 
todos los de energía negativa están ocupados. Por supuesto, en un vacío 
perfecto ha de ser válida la ecuación de Maxwell 


div é€ = 0. 


Esto significa que la distribución infinita de electrones de energía nega- 
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tiva no contribuye al campo electrónico. Únicamente contribuirán a la den- 
sidad eléctrica jo de la ecuación de Maxwell 


div € = 4rjo. (58) 


las desviaciones respecto a la distribución de vacío perfecto. 

Habrá, por lo tanto, una contribución —e por cada estado de energía 
positiva ocupado y una contribución -+ e por cada estado de energía nega- 
tiva desocupado. 

El principio de exclusión actuará corrientemente para impedir que un 
electrón de energía positiva haga transiciones a estados de energía negativa. 
Sin embargo, siempre será posible para este electrón pasar a un estado de 
energía negativa desocupado. En este caso desaparecerán simultáneamente 
un electrón y un positrón, emitiéndose su energía en forma de radiación. 
El proceso inverso consistiría en la creación de un electrón y un positrón 
a partir de radiación electromagnética. 

De la simetría entre estados fermiónicos ocupados y desocupados dis- 
cutida al final de $ 65, deducimos que la presente teoría es simétrica res- 
pecto a los electrones y positrones. Si supusiéramos que los positrones fuesen 
las partículas básicas descritas por ecuaciones de onda de la forma (11) 
con —e en vez de e, suponiendo que casi todos los estados de energía 
negativa de los positrones están ocupados, e interpretando un hueco en la 
distribución de positrones de energía negativa como un electrón ordinario, 
tendríamos una teoría equivalente. Dicha teoría podría desarrollarse de 
acuerdo con la hipótesis de que todas las leyes de la física son simétricas 
respecto a cargas eléctricas positivas y negativas. 


XII 


ELECTRODINÁMICA CUÁNTICA 


74. El campo electromagnético en ausencia de materia 


En la teoría de la radiación establecida en el capítulo X, al estudiar 
la interacción de la radiación con la materia, nos vimos obligados a intro- 
ducir algunas aproximaciones. El objeto del presente capítulo es eliminar 
estas aproximaciones y obtener, dentro de lo posible, una teoría rigurosa 
de la interacción del campo electromagnético con la materia, sujeta a la 
limitación de que la materia conste solamente de electrones y positrones. 
Las otras formas de materia (protones, neutrones, etc.), son todavía poco 
conocidas para intentar obtener de momento una teoría rigurosa de su 
interacción con el campo electromagnético. En cambio, existe una buena 
teoría precisa de los electrones y positrones, dada en el capítulo anterior, 
que permite construir una teoría precisa de la interacción del campo elec- 
tromagnético con dichas partículas. La teoría ha de contener tanto la inter- 
acción de los electrones y positrones entre sí, dada por las fuerzas de 
Coulomb, como su interacción con la radiación electromagnética, y ha 
de satisfacer, por supuesto, los. principios de la relatividad restringida. 
Para abreviar tomaremos en este capítulo c = 1. 

En primer lugar consideraremos el campo electromagnético sin inter- 
acción con la materia. En $ 63 establecimos por primera vez un modo de 
tratar el campo de radiación sin interacción con la materia. Introdujimos 
variables dinámicas para describir el campo, establecimos las relaciones 
de conmutación entre ellas, y encontramos un hamiltoniano que expli- 
caba correctamente su variación con el tiempo. En esta ocasión no hicimos 
aproximaciones. Por lo tanto, la teoría resultante sería exacta y satisfac- 
toria si no fuera por haber tomado el potencial escalar igual a cero. Esto 
destruye la forma relativista de la teoría y la hace inadecuada como punto 
de partida para desarrollar una teoría rigurosa del campo electromagné- 
tico en interacción con la materia. 

Tenemos que extender, por lo tanto, el tratamiento de $ 63 conser- 
vando un Aj general e introduciéndolo en la teoría junto con los otros 





¡ 
$ 
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potenciales As, Az, Az. Las cuatro A, que así tendremos, verificarán las 
ecuaciones que se obtienen generalizando (62) de $ 63, 


DA, =0, (1) 
DA,/Ox, = 0, | | h (2) 


Por ahora dejaremos de lado la segunda de estas ecuaciones y solamente 
consideraremos la primera. 

La ecuación (1) muestra que cada A, puede descomponerse en ondas 
que avanzan con la velocidad de la luz. Así pues, en gar de la ecua- 
ción (63) de $ 63 resultará ahora MT 


A)= ) (Aetz+ Aneto) dk, (3) 
donde k.x indica el producto escalar cuatridimensional 
k.x = Kkoxo — (k, x), 


siendo k, el cuadrivector cuyas componentes espaciales son iguales a las 
componentes del vector tridimensional k de $ 63 y cuya componente tem- 
poral es ky = |kl; d$k indica dk,dkadk;, como en $ 63. 

La componente de Fourier A, , tiene una parte Ap procedente de Ayíx) 
y una parte A,; (r = 1, 2, 3), que es un vector tridimensional. Este último 
puede descomponerse en dos partes, una parte longitudinal dirigida según 
la dirección de k, que es la dirección de movimiento de las ondas, y una 
parte transversal perpendicular a k. La parte longitudinal es k,k,/ko? - As. 
La parte transversal es 


(rs a kks/KoDA sy — Ar, (4) 


que verifica la condición 


kr = 0. (5) 


Se sabe por la teoría de Maxwell de la luz que solamente la parte 
transversal actúa dando radiación electromagnética. En el capítulo X úni- 
camente se consideró la parte transversal: la A,, de $ 63 es la misma que 
la .4,, de ahora y la ecuación (65) de $ 63 corresponde :a la ecuación (5). 
Sin embargo, la parte longitudinal no puede despreciarse en una teoría 
completa de la electrodinámica a causa de su relación con las fuerzas de 
Coulomb, como veremos más adelante. 

Podemos descomponer ahora el vector tridimensional A,(x) en dos 
partes, una parte transversal con sólo componentes de Fourier transversa- 
les y una parte longitudinal con sólo componentes de Fourier longitudi- 
nales. La primera es 


Ala) = | (Acto 4 7 000) E 
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que verifica 
04H L[x)/0x, = 0. (6) 


La parte longitudinal puede expresarse como el gradiente 0V/0x, de un 
escalar dado por 


V=¿f h,/k2- (Aug 000? — Asa 0109) dk (7 
Luego, 
Aj = ¡pe OV/0x,. (8) 


El campo magnético queda determinado por la parte transversal de A, 
HF =— rot A = rot $. 


Es conveniente tomar Ao(x) longitudinal, y así los potenciales comple- 
tos A,(x) quedan separados en una parte transversal .%,(x) y una parte 
longitudinal Ay, 0V/2x,. Esta separación se refiere, por supuesto, a un sis- 
tema de referencia de Lorentz particular y no ha de usarse .cuando se 
quiere conservar una ecuación en forma relativista. 

Cada coeficiente de Fourier A,x aparece en (3) combinada con el 
factor temporal eto, El producto 


Á ke ertoro — Á ut (9) 


es una variable dinámica canónica en mecánica clásica, y en mecánica 
los P.B. entre estas variables. 

El desarrollo de $ 63 nos da los P.B. para la parte transversal de A, ue. 
Para determinarlos, pasamos a valores discretos de k en el espacio tridi- 
mensional de k y tomamos un valor discreto de k particular, por ejemplo, 
k, = kz =0, kz = ky > 0. La variable de polarización 1 puede tomar 
entonces dos valores relativos a las dos direcciones 1 y 2, y la ecuación (73) 
de $ 63, con la ayuda de las relaciones de conmutación de las 7 y las 7, 
o sea las ecuaciones (11) de $ 60, da 


[Aruts Arne] = [A2xt Azni] = — ¿Su/4r Ko. (10) 


El desarrollo de $ 63 no nos da información sobre Azxt y Aoke- 

Sin embargo, podemos obtener ahora los P.B. para Azxe y Aows a partir 
de la teoría de la relatividad. Las ecuaciones (10) han de completarse para 
formar un conjunto relativista, y la única manera sencilla de hacerlo es 
añadiendo las dos ecuaciones 


[Asut Asxi] = — [Aous, Aoxe] = — 18x/47"ko, (11) 


de modo que las cuatro ecuaciones (10) y (11), junto con las condiciones de 
que Axe y A,x: conmuten para p. > y (ya que se refieren a grados de li- 
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bertad distintos), se puedan reunir para formar la ecuación tensorial única 


[Axe A ut) — 18 5H /4trko. (12) 


Obtenemos así los P.B., para todas las variables dinámicas. La ecuación 
(12) puede generalizarse así 


LA 1 A kt) == 18 Sd xu,/ArKo. (13) 


Consideremos de nuevo valores continuos de k. Para transformar 3xk. 
a valores continuos de k observemos que, para una función general f(k) en 
un espacio tridimensional de k 


S fr = H) =) [KB (14) 
k 
donde 3(k —k') es la función 3 tridimensional 
3(k —K') = 3(k, —K)a(k,, — KJa(k, —K.). 


Para que (14) coincida con la ecuación tipo que relaciona sumas e inte- 
grales, es decir, la ecuación (52) de $ 62, debe ser 


Sir. = Sk — K'). (15) 
y así (13) da 
[A ue Ax] _— 18 ,,/4 kg . 3(k — k”). (16) 
Esta ecuación, junto con las ecuaciones 
[Arto A m1] —= [A ke A kt] = 0, (17) 


constituyen los P.B. en la teoría de valores continuos de k. Debemos tener 
en cuenta que estos P.B. conservan el mismo valor si se omite en ellos el 
subíndice t refiriéndose entonces a los coeficientes de Fourier constantes 
Á to Ak 

Hemos de obtener ahora un hamiltoniano que haga variar en la ima- 
gen de Heisenberg cada variable dinámica A,,x+ con el tiempo t = xo, de 
acuerdo con la ley (9) con A, constante. Llamando Hp a este hamiltonia- 
no, debe ser 


[Axe H n] == AA ni/Axo paco KA tes: (18) 


Puede verse fácilmente que esta ecuación es satisfecha por 


H» == — 4 KA AC dk. (19) 


Tomamos, por lo tanto, (19), con la posible adición de un término numérico 
arbitrario que no contenga ninguna variable dinámica, como el hamil- 
toniano del campo electromagnético en ausencia de materia. 

En $ 63 empleábamos nuestro conocimiento de la parte tranversal del 
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hamiltoniano para obtener los P.B. de las variables transversales. Después 
hemos aplicado el procedimiento inverso a las variables longitudinales: 
hemos empleado nuestro conocimiento de los P.B., obtenidos mediante un 
argumento relativista, para hallar la parte del hamiltoniano que hace refe- 
rencia a ellas, eligiéndola de forma que esté de acuerdo con (18). 

Si desarrollamos el hamiltoniano (19) obtenemos 


Hy = 4 | KArAr ue + AxutAoxt 58 AstAsue — AoxtAox:) dk. 


Los primeros tres términos del integrando tienen una parte transversal que 
es igual a la energía transversal dada por (71) de $ 63. El último término 
del integrando, que es la parte de Hy relativa al potencial escalar Ap, apa- 
rece con un signo menos. Este signo menos está determinado por la relati- 
vidad y nos dice que el sistema dinámico formado por las variables Aou:, 


Aox: es un oscilador armónico de energía negativa. Es bastante sorpren- 
dente que aparezca así en la teoría un concepto tan poco físico como es el ' 
de energía negativa. Veremos en $ 77 que la energía negativa asociada 


a los grados de libertad que provienen de Ao siempre queda compensada 


por la energía positiva asociada a los otros grados de libertad longitudi- : 


nales, de modo que en la práctica nunca se manifiesta. 


75. Expresión relativista de las condiciones cuánticas 


Las ecuaciones de campo de la teoría expuesta en la sección precedente 
eran relativistas. Para que la teoría sea completamente relativista debemos 
demostrar que también son relativistas los P.B. En su forma (16) expresada 
en función de componentes de Fourier la cuestión no es evidente. Vamos a 
obtener una expresión relativista de los P.B. desarrollando [A,.(x), A,(w)], 
siendo x y x” dos puntos del espacio-tiempo. Pero para ello hemos de estu- 
diar previamente una función del espacio-tiempo singular e invariante. 

La función 3(x,x“) es evidentemente invariante frente a las transfor- 
maciones de Lorentz. Se anula en todo el espacio excepto sobre el cono de 
luz que tiene coman vértice el origen, es decir, sobre el espacio tridimen- 
sional x,x" = 0. Dicho cono de luz consta de dos partes diferentes, una 
parte de futuro para la cual xy > 0, y una parte de pasado para la cual 
xo < 0. La función que sobre la parte de futuro del cono de luz toma el 
valor 3(x,x“) y sobre la parte de pasado el valor —3(x,x“), también es 
invariante frente a las transformaciones de Lorentz. Dicha función, que 
puede escribirse en la forma 9(x,x“)x0/(x%|, juega un papel importante en 
la teoría dinámica de campos, por lo cual introducimos una notación espe- 
cial para designarla. Por definición, 


A(x) pea 20 (x,x")x%0/1Xol. (20) 
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Esta definición da sentido a la función Á aplicada a cualquier cuadrivec- 
tor. Con ayuda de (9) de $ 15, podemos expresar 3(x,x"“) en la forma 


d(x,21) = 31x¡*B(%0 — lx) + 3(xo + [x1)), (21) 


donde |x| es la longitud de la parte tridimensional de x,; con ello A(x) toma 


u>? 


la forma 

Ax) = [x*8(xo — [x]) — 3(xo + [x))). | (22) 
El valor de A(x) en el origen se toma igual a cero, y en consecuencia, 
Ax) = —A(x). 


Hagamos un análisis de Fourier de A(x). Poniendo dtx en lugar de 
dxodxidxodx3, y dex en lugar de dx,dxudx; para un cuadrivector k, cual- 
quiera se tiene, 


| aforo ar = | xi 13(x0 — [x) —Slxo + ix) etico de 
| pe E IS d3x. 
Introduciendo ahora coordenadas polares |xi, 9, $ en el espacio tridimen- 
sional x,x2X3 y tomando como polo la dirección de la parte tridimensional 
de k,, resulta 
f A(xjetk= dex > F ] Leikolxi _— grikolxi) e7|k|Ixjcos %xisen edededix! 
00 T 
= Y | fettolxl —. gtKoix1) dx] [ estucos Jxjsen 6 de 


0 
== Amilki1 f (omita) dixifertkilx! — giikilx]) 
0 


oo 


=> Ami | [esto Ika __ gitko+lk) ra) ¿a 


— 4r*ilk|*(3(ko — |k¡) — S(Ko + [k|)) 


= 4r*iA(k). (23) 


Luego, la transformada de Fourier es la misma función con el coeficiente 
47*i. Intercambiando en (23) k y x, resulta 


A(x) = —i/4r2. f A(k)eie= dik. (24) 


Algunas de las propiedades más importantes de A(x) pueden dedu- 
cirse de su análisis de Fourier. En primer lugar, la ecuación (24) nos 
permite ver que Á(x) puede descomponerse en ondas que avanzan a la 
velocidad de la luz. Para obtener una ecuación que dé cuenta de este 
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resultado, aplicamos el operador (] a ambos miembros de (24), resultando 
DA(«) = —i/4r. f A(k)Detez dk = 1/4m. l ke, dA(kjetez dix. 


Y como k,k“A(k) = 0, se tendrá 


Esta ecuación se verifica en todo el espacio-tiempo. Para dar sentido a 
DJA(x) en los puntos en que A(x) es singular, hemos de tomar la integral 
de DJA(x) extendida a un pequeño volumen cuatridimensional que rodee al 
punto en cuestión, y transformarla luego mediante el teorema de Gauss, 
en una integral de superficie tridimensional. La ecuación (25) nos dice que 
dicha integral de superficie tridimensional siempre es nula. 

La función A(x) es nula sobre toda la superficie tridimensional xy = 0. 
Hallemos el valor de 9A(x)/0xo, sobre dicha superficie. Evidentemente es 
nulo en todo punto excepto en X; = Xa = X3 = O, donde presenta una 
singularidad que vamos a calcular a continuación. Derivemos ambos miem- 
bros de (24) respecto a Xo, 


OA(x)/€xo = 1/4m? . , koA(k)erz dik 
— 1/47. | ko[ki71£3(k, — [k]) — 3(ko + [k!))e*" d*k 
= 1/47? . j (3(k, — [k|) + 3(ko + Ik|))e%= dk. 
Poniendo ahora x. = 0 en ambos miembros, resulta 
[2A()/0%o1a0:o = 1/41”. f (3(ko —|k)) + 3(ko + [k)e7+000 dek 
pe 1/25. | eu d3k 
= 4 0(x1)0(x») dx.) = Ar 3(x). (26) 


Luego en el punto xy = xXx» = X3 = O aparece la singularidad 4 ordinaria 
con el coeficiente 47. 
Calculemos ahora [A 


[A, (x), 4,(1)] 
Ñ IN [A 5 ga + Á k gar Ao gua + Ak. gara d*kd*k! 


m7 


(x), A,(x)]. A partir de (3), (16) y (17) tenemos 


== 18, /4m?. $ | ko Ue ikzagio_ gitvag=i00) 3(k — k') dkd3k' 
= ig,,/4n?. ¡ ko ein _ gia) 3. (27) 


El k, que figura aquí es por definición igual a |k| y, por tanto, es siempre 
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positivo. Poniendo — k en lugar de k en la segunda parte del integrando, 
deducimos que (27) es igual a la integral cuádruple 


18, /4m?- f [Kk|1(3(ko — |k/) —3(ko + |k|))e7*:2-2> dix 
= ig,,/4m? . f A(k)e (2-2) dk, 


donde ky puede tomar todos los valores, tanto positivos como negativos. 
Hallando el valor de este término con ayuda de (24), obtenemos final- 
mente 


[A,(x), A,(x")] == 8,A(x e x”), (28) 


resultado que nos muestra claramente que los P.B. son invariantes frente 
a las transformaciones de Lorentz. 

La fórmula (28) nos dice que los potenciales en dos puntos cuales- 
quiera del espacio-tiempo conmutan siempre salvo en el caso en que la 
línea que une ambos puntos sea una línea nula, es decir, una trayectoria 
luminosa. Dicha fórmula está de acuerdo con las ecuaciones de campo 
(JA, (x) = 0, puesto que según (25), al aplicar (] al segundo miembro 
da cero. 


76. Variables dinámicas de Schródinger 


Para establecer la invariancia de una teoría cuántica de campos frente 
a las transformaciones de Lorentz, la imagen más conveniente es la de 
Heisenberg, que empleábamos en las dos secciones anteriores. Pero para 
estudiar ejemplos concretos sigue siendo necesaria la imagen de Schró- 
dinger. La teoría expresada en imagen de Schródinger aparentemente no 
tiene forma relativista, pues considera estados en un instante de tiempo 
y se pregunta cómo varían dichos estados con el tiempo y, por tanto, se 
refiere fundamentalmente a un sistema de referencia de Lorentz particular. 
Sin embargo, una vez comprobado que una teoría es relativista puesta en 
imagen de Heisenberg, no tenemos por qué preocuparnos por la apariencia 
. no relativista de dicha teoría puesta en imagen de Schródinger, pues sabe- 
mos que ambas imágenes son equivalentes. 

Para trabajar en imagen de Schródinger hemos de introducir variables 
dinámicas adecuadas que describan el campo en un instante dado. Las 
cantidades A,(x) y 0A,/0xo, particularizadas para todos los valores de 
X1, X2, X3, y un valor fijo de xy son suficientes para determinar A, en todo 
instante con ayuda de la ecuación de campo (1); por lo tanto, dichas can- 
tidades pueden tomarse como las variables dinámicas en un instante de 


300 ELECTRODINÁMICA CUÁNTICA 


tiempo y, en consecuencia, como las variables dinámicas en la imagen de 
Schródinger. Pongamos 


B, = DA, /OXo. (29) 


Entonces las variables dinámicas en la imagen de Schródinger serán A, 
Bx» donde x representa X1, X2, Ya. 
El análisis de Fourier de dichas variables es, según (3) y (9). 


Ax = | (Aj + Apraje 0 dk, 


(30) 
Barx = 4 hol pro— Ajeno 

Podemos invertir la transformación de Fourier y expresar Axe + A,-1e 
y Axe — A, ue en función de A,x y B,x respectivamente. Luego A xt y 
A xs: quedan determinadas por A,x y B,x particularizadas para todo x (y 
un xo fijo), y en consecuencia, también podemos tomar como variables 
dinámicas en un instante de tiempo las A, xt Axe que constituyen, por 
tanto, un nuevo conjunto de variables dinámicas de Schródinger. 

Si queremos trabajar con las variables A,x, B,x €s necesario conocer 
sus P.B. Se pueden obtener bien a partir de los desarrollos de Fourier (30) 
y las ecuaciones (16) y (17), o bien a partir de la forma general (28) de 
los P.B. El segundo procedimiento nos da los resultados que queremos 
más directamente. Si en (28) hacemos xy = xo, resulta 


[Ax Ayx.] = O. | (31) 


Derivando (28) respecto a xo y haciendo luego xi = *o, con ayuda de 
(26), resulta 
[B.x Ax] = 478, Ox — x”). (32) 


Derivando (28) respecto a xo y respecto a x'o y haciendo luego y = xo ob- 
tenemos 


[B.x Byx] = 0, (33) 


puesto que para xy = O, 0?A(x) /0x5 = O. Las ecuaciones (31), (32) y (33) 
nos dan todos los P.B. entre las variables A, x, B,x. Según ellas vemos que, 
salvo coeficientes muméricos, las A, pueden ser consideradas como un 
conjunto de coordenadas dinámicas y las B,, como momentos canónicos 
conjugados; en el segundo miembro de (32) aparece una función 3 en lugar 
de un símbolo 3 con dos subíndices, debido a que el número de grados 
de libertad es un infinito continuo. 

Podemos descomponer A,, en una parte transversal y otra longitudi- 
nal, como indican las ecuaciones (8) y (6). Para B,, podemos hacer lo 
mismo, obteniéndose 


B, = %B,+0U/0x, (34) 
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donde 
OB,/0%, = 0. (35) 


A partir de (7), sustituyendo k por —k en el segundo término del inte- 
grando, resulta y 








V=i f kaKko Ane + Aries di. (36) 
La ecuación correspondiente para U, dado que U —= 0V/0xo, es 
U=-= l Ka Ko UAsxe — ArmJe 00 dk. (37) 
El campo eléctrico viene dado por 
O(A) + U 
O (38) 
OXr ÓXp 
Luego 
OB, 
div é€ = — . — V?A, = — V*(Ao + U). (39) 
cs 


Es evidente que toda variable longitudinal conmuta con toda variable 
transversal. Ahora vamos a desarrollar algunos P.B. de gran utilidad. 
Emplearemos la notación 








2) Ono ; 
ZAfr r 40 
OX, he, ex, Fx" 40) 


donde fx designa una función de campo cualquiera. 
Si en (32) hacemos y. = r, y = s y derivamos la ecuación respecto a x,, 
obtenemos 


[Bro Asx.] = Agr (x— xXx) = — 40 "(x — x"), 


o, según (39), 
[div E, Asx] = 4r8(x — Xx”). (41) 


Ahora bien, (39) nos muestra que div € es una función de las variables 
longitudinales únicamente, y por lo tanto, (41) da 


[divE,, V,*] —= 4r8'(x —x') = —4n0"(x — x”). 
Integrando respecto a x;, obtenemos 
[div €,, V,] — —4n3(x —x”, (42) 


donde no aparece ninguna constante de integración, ya que las funciones 
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de campo €, y V, están formadas por ondas de longitud de onda no nula. 
De (42) y (39) resulta 


VU, Vx] = 4n0(x — x'). 
Integrando con ayuda de la fórmula (72) de $ 38, obtenemos 
[Uz, Vx] = —|Ix—x'[", (43) 


no apareciendo tampoco en el segundo miembro ninguna constante de in- 
tegración u otros términos que no se anulen en el infinito, debido a que 
Us, y V, están formadas asimismo por ondas de longitud de onda no nula. 
A partir de (38) y (43) tenemos 


¡Céz, Vx.) A LUSS Vi o CGERR (x, > x;) px > xa (44) 


Vamos a obtener ahora la expresión del hamiltoniano en función de 
las variables A,x yB,x. De la segunda ecuación (30) resulta 


| Bx B“, dex 
= ff [oo Ar MA o EA RR 
— —8n8 Í f Rol (A ice — Aya A oi — Alo Ja 4 de) del” 
— —8né ] RNA 1 — AA cs — A 0) BR, 
Análogamente, de la primera ecuación (30), 
1 A, CA% dix 
ps el RARA e HA A e FA o je O EUR dd dex 
— 8n al ROA nue + A MA us + AL 4) dk 
Sumándolas y dividiendo por — 8x, resulta 
— (8x)1 f (B, Bu + A,A0) diz 
= —2 / KA 10 Alto YA es A) dB. 
que es igual al H» de (19) salvo un término numérico infinito. Ya vimos que 
la fórmula (19) para Hp dejaba en libertad un término numérico arbitrario, 


y así pues podemos tomar 


Hp = — (87)? | (B, B“ + A,“A07) dix (45) 


con un término numérico arbitrario distinto del de (19). 
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Por supuesto, el hamiltoniano (45) puede utilizarse igualmente para 
establecer las ecuaciones del movimiento de Heisenberg, pues el término 
numérico arbitrario que figura en él no tiene ningún efecto. Puede com- 
probarse fácilmente que empleando (31), (32) y (33), resulta 


DA, /O0Xo proa [A,, HH] == B,, 
y (46) 
OB, /0xXo == [B,, Hp] = V2A,, 


que coinciden con (29) y (1). Asimismo permite obtener la ecuación de 
movimiento de Schródinger 


ih dUIP>/dxo = H y|P> 


para un ket |P> que represente un estado en la imagen de Schródinger. 
El término numérico arbitrario modifica a |[P> en un factor de fase, cues- 
tión ésta que no tiene importancia física. 

Podemos descomponer la expresión (45) de Hy en una parte transver- 
sal Hpp y otra longitudinal H»,. A partir de (34) tenemos 


| 


/ B, B, dix f (B, + UG, + Ur) d3x 
= ll BB, dx + fUryr dex, 
ya que los términos cruzados son nulos, pues según (35), 
f UB, Pr = f UL, dix =0 
Análogamente, a partir de (8), resulta 


/ AA,s dix — f ALAS dix + ás dx, 


siendo también nulos los términos cruzados. Luego, (45) es igual a 


H» —= H pr + Hr, 
con 


Hyr = (8m)1 / (BB, y AA) dir (47) 


Hs, = (8x)2 f UU" 4- Vrsyrs — B¿B, —Ag"Ap”) dx. (48) 
Tengamos en cuenta que el término 


(Sr)"2 1 ASA? dix 
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de Hyy puede transformarse en 
— (87) f A, A dx = —(8r) 1 f ANAL — A 1) dix 
= (8m)1 f ALA AL A) Pr 
= (16x)"2 ij (A — A AZ A y) dx 
= (81) | ARd3x, 


y por lo tanto, dicho término es precisamente la energía magnética. Nuevas 
integraciones por partes dan 


j Vrsy ra dx — ! Vr y ss d3x, 
y con ello (48) puede ponerse en la forma 


Hp, = (8n) 1 f ((U— AJ)(U + Ap) +(V — ByX(V* + Bo) dex. (49) 


77. Condiciones suplementarias 


Volvamos a la ecuación de Maxwell (2), que hasta ahora no habíamos 
tenido en cuenta. No podemos introducirla directamente en la teoría cuán- 
tica sin que se produzcan contradicciones. El primer miembro de la ecua- 
ción, según las condiciones cuánticas (28), no conmuta con A,(x”) y, en 
consecuencia, no puede ser nulo. El método de evitar la dificultad fue 
indicado por Fermi. Consiste en tomar una ecuación menos exigente 


(2A,/ex,)1P> = 0. (50) 


suponiéndola válida para todo |P> que corresponda a un estado que pueda 
darse en la naturaleza. Existe una ecuación (50) para cada punto del espa- 
cio-tiempo, y todo ket que corresponda a un estado que pueda darse en la 
naturaleza, habrá de verificar todas esas ecuaciones. 

Las condiciones que, como (50), deben verificar los kets que corres- 
ponden a estados que pueden darse en la naturaleza las denominaremos 
condiciones suplementarias. La existencia de condiciones suplementarias 
en la teoría no lleva consigo ninguna desviación o modificación de los 
principios generales de la mecánica cuántica. El principio de superposición 
de los estados y toda la teoría de estados, variables dinámicas y observa- 
bles dada en el capítulo 11 sigue siendo aplicable aunque existan condi- 
ciones suplementarias, si imponemos una nueva condición para que un 
operador lineal sea un observable. Diremos que un operador lineal es 
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físico, si tiene la propiedad de que, al aplicarlo a un ket cualquiera que 
verifique las condiciones suplementarias, da como resultado otro ket que 
también las verifica. Para que un operador lineal pueda representar un 
observable, además de las condiciones de $ 10, tendrá que satisfacer la 
nueva condición de ser físico. 

Ya vimos un ejemplo de condición suplementaria en la teoría de los 
sistemas que contienen partículas idénticas. La condición de que única- 
mente las funciones de onda simétricas, o únicamente las funciones de onda 
antisimétricas, representen estados que puedan darse en la naturaleza es 
precisamente una condición del tipo (50), y constituye lo que hemos lla- 
mado una condición suplementaria. En dicha teoría, la condición para que 
un Operador lineal sea físico es que sea simétrico en las partículas. 

Al introducir condiciones suplementarias en nuestra teoría, hemos de 
comprobar que son coherentes, es decir, que no son tan restrictivas como 
para que ningún ket las verifique. Si tenemos más de una; condición suple- 
mentaria, podemos deducir nuevas condiciones suplementarias a partir de 
ellas tomando los P.B. entre los operadores que figuran en las mismas; así, 
si en una ocasión tenemos las condiciones 


UIP> =00, MP =0, (51 
podemos deducir 


[O VIP> =00, [U, [U, VIJIP> = O, (52) 


y asi sucesivamente. Para comprobar que las condiciones suplementarias 
son coherentes hemos de considerar todas las que se pueden obtener por 
este procedimiento y ver que pueden ser satisfechas a la vez; lo que co- 
rrientemente se consigue demostrando que tras un cierto número de pro- 
cesos de este tipo, las nuevas condiciones suplementarias se verifican idén- 
ticamente o bien son repeticiones de las ya obtenidas. 

Asimismo hemos de comprobar que las condiciones suplementarias 
están de acuerdo con las ecuaciones del movimiento. En la imagen de 
Heisenberg, en la que el ket |P> de (51) es fijo, tendremos distintas condi- 
ciones suplementarias relativas a los distintos instantes, y todas ellas tienen 
que ser coherentes en el sentido que hemos indicado. En la imagen de 
Schródinger, el ket |P> varía con el tiempo según la ecuación de Schró- 
dinger, y hemos de exigir que si |P> verifica las condiciones suplementa- 
rias en el instante inicial las siga verificando también en todo instante. 
Esto es equivalente a exigir que d|P>/dt satisfaga las condiciones suple- 
mentarias, o sea, que HÍ[P> las satisfaga, que es lo mismo que exigir que 
H sea físico. | 

Cuando se tiene una condición suplementaria U[P> — 0, es conve- 


niente escribir 
UzO (53) 


20. — CUÁNTICA 
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diciendo que (53) es una ecuación débil, para distinguirla de una ecuación 
ordinaria o fuerte. Multiplicando una ecuación débil a la izquierda por un 
factor obtenemos una nueva ecuación débil, pero, en general, si el factor 
se multiplica por la derecha no se obtiene una ecuación consecuencia de la 
anterior. Luego, las ecuaciones débiles no deben emplearse para calcular 
los P.B. Con esta nomenclatura, la condición (52) para que las condiciones 
suplementarias sean coherentes equivale a la condición de que los P.B. 
de los operadores que determinan las condiciones suplementarias sean nulos 
débilmente. 

La condición para que una variable dinámica £ sea física es que para 
cada ecuación suplementaria U|P> = 0 se tenga 


UÉlP> = 0, 
y por tanto, que 
[U, ¿]IP> = 0. 


Luego, la condición es que el P.B. de la variable dinámica con cada uno 
de los operadores que determinan las condiciones suplementarias sea nulo 


débilmente. 
Volvamos a la electrodinámica. Consideramos la ecuación (2) como 
débil; por tanto, debemos escribirla 


DA, /0x, = 0. (94) 
En la imagen de Heisenberg tenemos una de estas ecuaciones para cada 


punto x. Para ver que son coherentes, tomamos dos puntos x y x” arbitra- 
rios del espacio-tiempo y construimos el P.B. 


| 0A,(x) ' ae | _ [A,(0, A]. 


Ox, Ox, Ox ,0x, 








Calculándolo con la ayuda de (28), resulta 
0?2A(x — x') 
OS — DA(x—x) = 0 
U y” 

según (25); luego, las condiciones de coherencia se verifican fuertemente. 
Al comprobar que las condiciones suplementarias son coherentes en todo 
instante en la imagen de Heisenberg, queda comprobado que están de 
acuerdo con las ecuaciones de movimiento. 

Puesto que (54) es una ecuación débil, todas sus consecuencias de la 
teoría de Maxwell ordinaria serán válidas en la teoría cuántica única- 
mente como ecuaciones débiles. Las ecuaciones 


div H = 0, OH/0t = —rot € 


son consecuencia inmediata de las definiciones de € y MY en función de 





"TÍ. CONDICIONES SUPLEMENTARIAS 307 


los potenciales y, por lo tanto, serán válidas fuertemente también en la 
teoría cuántica. Las otras ecuaciones de Maxwell en el vacío 


div € z 0, DE/0t Z rot H, (55) 


en teoría cuántica serán ecuaciones débiles, pues para obtenerlas es nece- 
sario emplear tanto (54) como (1). 

Las cantidades de campo € y X son componentes del tensor antisimé- 
trico 0A”/0x, —0A"/0x,. El P.B. de dicho tensor con el operador de (54) 
en un punto x” general es 


ER 


, PAl(x—x') , OA (x — x”) 
ox, Ox, > ox N 


g =0. 
" ox ex, “ Ex, 0, 











al 


Por consiguiente, € y 4 son físicos. Los potenciales A, no son físicos. 
Las condiciones suplementarias que pesan sobre las variables dinámi- 
cas en un instante particular son 


DÁ o OA 
= z0, = z0,. (56) 
Ox, Oxo Ox, 











Nuevas derivaciones respecto a xo no dan lugar a ecuaciones indepen- 
dientes, sino a ecuaciones que son consecuencia de éstas y de la ecuación 
fuerte (1). Las condiciones suplementarias, puestas en función de las va- 
riables de Schródinger de $ 76, son 0 


B.+ A," TZ (57) 
e 
(Ag + B,)" Z 0. (58) 
La ecuación (58) es igual a la primera ecuación (55) y, según (39), puede 
escribirse también 


V2As + U) 3.0 


Puesto que esta ecuación se verifica sobre todo el espacio tridimensional, 
resulta 


A9 + UzZO. (59). 
Llamando A,” — V”, de (49) resulta 
Hy, zZ 0. (60) 


Luego, para los estados que se dan en la naturaleza la energía del campo 
longitudinal es nula. 

Con el fin de establecer una representación conveniente, introducimos 
un ket standard |0»> que verifica las condiciones suplementarias 


(Bo + A/NI0p»> = 0, (Ao + U)O07> = O, (61) 
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y además 


Estas ecuaciones son coherentes, pues .Y,. conmuta con los operadores 
de (61), y además son suficientes para determinar |0,> completamente, salvo 
un factor numérico, ya que las únicas variables dinámicas independientes 
que tenemos son Ao, Bo, U, Ar, Aru Ark y de ellas Ao + U, Bo + Ar”, 
XK , constituyen un conjunto completo. Con ayuda de este ket standard 
podemos expresar cualquier ket en la forma 


Y(Ao, Bo, A rx 0p>. (63) 


Esta representación es exactamente la representación de Fock en lo que 
concierne a las variables dinámicas transversales .Y,x, «Lrk y, por tanto, 
Y ha de ser de la forma de una serie de potencias en las variables %,x, 
cuyos términos corresponden a los distintos números de fotones presentes. 
El número de variables que figuran en la expresión de “YY es un infinito 
de la potencia del continuo, luego, Y es lo que en matemáticas se deno- 
mina un “funcional. 

Si el ket (63) verifica las condiciones suplementarias, “Y ha de ser inde- 
pendiente de Ay y Bo, y luego, ha de ser función únicamente de Koro 
Por tanto, los estados físicos están representados por kets de la forma 


(4 1) 107>, (64) 


siendo W' una serie de potencias en las variables %,. El ket standard |0»> 
representa el estado físico que corresponde a la no existencia de fotones, 
es decir, el vacío absoluto. 

Nuestro hamiltoniano Hp y sus partes H pz, Hpr contenian hasta ahora 
términos numéricos arbitrarios. Es conveniente elegir dichos términos de 
modo que, en el vacío absoluto, tanto Hp como H yy sean nulos. La con- 
clusión (60) indica que en el Hp, dado por (48) o (49) ya hemos elegido 
correctamente el término numérico para que Hp. valga cero en el estado 
de vacío absoluto y así como en los demás estados físicos. Si queremos que 
no exista punto cero de energía para los fotones, hemos de elegir el tér- 
mino numérico de la parte transversal de (19) de modo que Hpr valga 


Hop == dr | krai dk, (65) 


(47) difiere de (65) en un término numérico infinito que consiste en medio 
cuanto de energía para cada estado fotónico. 
78. Electrones y positrones aislados 


Vamos a considerar ahora electrones y positrones en ausencia de campo 
electromagnético. El estado de un electrón viene dado, como en el capí- 
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tulo XI, por una función de onda + con cuatro componentes Y (a = 1, 
2, 3, 4), que verifica la ecuación de ondas 
OY O 
ih 4 = —ih 0, E + Um ME. (66) 
ÓOXo OXy 


Para obtener una teoría aplicable a un conjunto de electrones, aplicare- 
mos el método de segunda cuantificación de $ 65, que consistía en susti- 
tuir la función de onda de un electrón por un conjunto de operadores que 
verifican ciertas relaciones de anticonmutación. 

Cuando consideremos la y en distintos puntos en un instante dado 
escribiremos +4, donde x representa x,, X2, X3. Sus componentes serán ¿ax. 
Mediante una transformación de Fourier pasamos a la representación de 
momentos cuya función de onda es y4,. Se tiene 


Ue h3 f ena, d*p, Yo A | a EE 7 dex. (67) 


Yp tendrá también cuatro componentes y), en correspondencia con las 
cuatro componentes de y4,. En esta representación el operador energía es 


Po = % pr + Cm M, 


en el que los operadores momento p, son factores multiplicativos. 
Podemos separar 4 en una parte £ de energía positiva y otra £ de ener- 
gía negativa. 


Y = ¿+6 


donde £ y £ tendrán cada una cuatro componentes igual que y. En la 
representación de momentos vendrán dadas por 


£ A Ur Pr + %m M | 
"2 (pr ma 


ya que dichas ecuaciones nos llevan a 


Ay Pr E Um M 


1 | 
p> p ==31¡1— p> 68 
, SV y e 


Po Ep = (0 Pr + mn mi, = 31% Pr + %m mM+ (p* + mt 
= (p? + m?)*£,, 


y análogamente a 


A 1 Ls 


Po Lp = — (p" + mL, 


que nos dicen que £, y £¿ son autofunciones de py cuyos autovalores son 
respectivamente (p” + m”) y —(p* + m2). Trabajando con los opera- 
dores 


? 


1 Ar Pr + a 1 iS Ar Pr + Un M | 
2 (p? + m?) 4 (pr mejo 
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emos de tener en cuenta que sus cuadrados son iguales a sí mismos, y que 
su producto en cualquier orden es igual a cero. 

La segunda cuantificación transforma las ys en operadores del tipo de 
las 7 de $ 65, que verifican unas relaciones de anticonmutación del tipo 
de (11') de $ 65. Empleando la siguiente notación del anticonmutador 


MN + NM =— [M, N],, (69) 
resulta 
[Vaz box), = 0, [Bax, Fox). =0, 
[bax, Fox]. =/000 S(x — x”), (70) 


apareciendo en la última ecuación la función 3(x — x”) debido a que las x 
toman valores en un dominio continuo. Pasando a la representación P, 
mediante (67), obtenemos 


[Y ap, Y bp» ]+ = O, [Y ap, Pop. 1. — 0, 
[2% ap, Pop»). = dad 3(p — p'). (71) 


Definiendo también ahora £ y £ por (68), la última ecuación (71) da 








1 2 lil 1 As + Am M | 
ap» Sdp-1+ =— — 1 cp» lr — A 
e 
| 1 ¡ Ar Pr + Am M | , 
= 2314 ———— Mp—P) (12) 
21 (p2 me Sa 

y análogamente 
j 1 r Pr m M 

Ta A e ETE (13) 


21 y (p? + m*) ha» 
L£ap> Zop»]+ — (Cas Cola =:0% 


Según la interpretación de $ 65, los operadores ap SON operadores de 
aniquilación de un electrón de momento p y los ¿ap son operadores de 
creación de un electrón de momento p. A fin de evitar la noción no física 
de electrones de energía negativa, hemos de pasar a una nueva interpre- 
tación basada en la teoría de los positrones de $ 73. La aniquilación de un 
electrón de energía negativa debe ser considerada como la creación de 
un hueco en el mar de electrones de energía negativa, es decir, como la 
creación de un positrón. Con ello, los operadores £«p se convierten en 
operadores de creación de un positrón. El positrón tiene un momento — P, 
pues aniquila un momento p. Análogamente los Zap se convierten en ope- 
ralores de aniquilación de un positrón de momento — Pp. Los €up Y Sap 
son respectivamente operadores de aniquilación y creación de un electrón 
ordinario de energía positiva y momento p. 
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Observemos que aunque £p tenga cuatro componentes, únicamente dos 
de ellas son independientes, ya que las cuatro están relacionadas por 


f— Ar Pr LT Am M jo ól) 
(p? + m2?) 


que implica dos ecuaciones independientes. Los dos componentes de ¿p 
independientes corresponden a la aniquilación de un electrón en cada uno 
de los dos estados de spin independientes. Análogamente £, tiene única- 
mente dos componentes independientes a causa de las ecuaciones 


Ar Pr | Um M 
A 
Ena) 


y dichas componentes corresponden a la creación de un positrón en cada 
uno de los dos estados de spin independientes. 

El estado vacío en el que no existen ni electrones ni positrones está 
representado por el ket |0> que verifica 


Emf0p> =0,  Zapl0p> = 0. | (74) 


Podemos emplear dicho ket como ket standard de una representación. 
En ese caso cualquier ket se expresará en la forma 


Wi Lap) /0p> , 


donde la función, o mejor dicho el funcional Y es una serie de potencias 
en las variables Zap, Zap. Cada término de Y es análogo a (17') de $ 65. 
No puede contener ninguna de sus variables elevada a una potencia supe- 
rior a uno. Corresponde a un estado en el que existen electrones (de ener- 
gía positiva) y positrones, en estados determinados por los símbolos de las 
variables que en ella figuran. 

Según (12) de $ 65, el número total de electrones es igual a la suma de 


Bop Yap Ap para todo a. Escrito en la notación de la ecuación (12) 


de $ 67 es S py dp. Pasando a la representación x mediante (67), ob- 
tenemos 


pa [ff can cr, y Ap = | pg 


que nos dice que la densidad de electrones est, y, . Este resultado in- 
cluye una constante infinita que representa el mar de electrones de energía 
negativa. 

Obtenemns una cantidad con mayor significado físico tomando la carga 


> z 
a “y 
o; 
E o da a 
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total O, igual al número de electrones de energía positiva menos el nú- 
mero de huecos o positrones multiplicado por — e. Es decir, 


Olé f (818, — £12,) dep. (75) 


Podemos calcular esta expresión con ayuda de (68). Empleando la ecua- 
ción transpuesta de la segunda ecuación (68), es decir, 


cicle 


resulta 


1 % Pr + Um M e! al p, + a; m 
o A A PA 3p. 
e= 85 y (p? + m2)? 4 E (p? + m?) Js. dl 


Por otro lado, para toda matriz « cuya suma de elementos diagonales sea 
igual a cero, las relaciones de anticonmutación (71) dan 


e hp. + Ya —= Lal apt bp. + Lop Yap —= Yaa 3(p — p”) == 0, (76) 


resultado que podemos suponer cierto también para p” = p. Con ello la 
expresión de Q se reduce a 


Q=—o [HB 0A,) dp. 
Pasándola como antes a la representación X, resulta 

Q = —e 1 Au, — E da, 
que nos dice que la densidad de carga es 


jox = — +A —b 8). (77) 
Además de la densidad de probabilidad ty, la interpretación de la 


función de onda de un electrón dada en $ 68 determina también una co- 
rriente de probabilidad Y*a,. En correspondencia con ello, para la se- 
gunda cuantificación tendremos un flujo de electrones determinado por el 
operador ¿54 2,3). El mar de electrones de energía negativa, por simetria, 
no da lugar a ningún flujo de electrones resultante y, por consiguiente, la 
corriente eléctrica vale ? 


Írx == — EN Ar 8h xo (78) 


-. Cb 
A me e. 
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Según la fórmula (29) de $ 60, válida también para fermiones, la energía 
total de los electrones es 


H» = f q Podp dep = | Jl (2, Pr + An my, dep. (79) 
Puesta en representación x es 


Hp. = pr (—iña, dh," + a mb) dix. (80) 


Esta expresión de la energía total contiene un término numérico infinito 
que representa el mar de electrones de energía negativa. 

Obtenemos una cantidad de mayor significado físico considerando 
la energía de todos los electrones y de todos los positrones, y tomando la 
energía del vacío igual a cero. Dicha cantidad es 


Ho = [94m xElE, + EZ) dp (81) 
Ñ 1 Ly Pr + Am M 
= / (p? + ne» Y 2 1+ Me + me) la E 


1 ap, + aj, m 
tl] d* 
+3 PA EN )v.| p 


= | AB pr+ an Mb) —d (a p, + al, mi ,) dep + 
+ | (94 mes de + 01H) dp. (82) 


Según (76), la primera integral de (82) es idéntica a (79) y por consiguiente, 
es igual a Hp.. La segunda es una constante infinita, que es igual a menos 
la energía de todos los electrones de energía negativa de la distribución 
de vacío. 

Podemos tomar como hamiltoniano bien Hp o bien Hp.. Luego, la 
ecuación de movimiento de Heisenberg para 4, es 


Ob ax/OXo = [baz Hp] — [box Hp, ], 


y si a partir de ella seguimos el desarrollo, volvemos a obtener la ecuación 
de onda (66) para y. 

Hemos de considerar ahora la cuestión de si la teoría es o no relati- 
vista. Está dada en función de operadores y que verifican las ecuaciones 
de campo (66). Cada una de dichas ecuaciones es de la forma de la ecua- 
ción de onda de un electrón, y como ya vimos, si las y se transforman según 
la ley (20) del capítulo XI, son invariantes frente a las transformaciones de 
Lorentz. A este respecto, la teoría presente va más allá que la teoría de un 
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solo electrón, por el hecho de haber introducido relaciones de anticonmu- 
tación para las y y Y, y es necesario comprobar que dichas relaciones son 
invariantes frente a las transformaciones de Lorentz. 

Vamos a proceder análogamente a como hicimos en $ 75. Consideremos 
dos puntos cualesquiera x y x” del espacio-tiempo y formemos el anticon- 
mutador 

Koy(x, 0) = balxhboa) qbo haz). (83) 
Podemos calcularlo directamente a partir de las relaciones de anticonmu- 
tación (71) de las componentes de Fourier de y y y. Otro método más 
sencillo es tener en cuenta ciertas propiedades que ha de tener Kuy(x, x”), 
que vamos a enumerar a continuación: 
(i) solamente depende de x, y x a través de su diferencia x,— a”: 
(ii) verifica la ecuación de onda | 








+ O 4 O 
( io a] Kodlx, x) = 0 (84) 


que se deduce teniendo en cuenta que y+(x) verifica (66); 
(iii) para xy = xx; tiene el valor 3,,3(x — x”), como puede verse a par- 
tir de la tercera ecuación (70). 

Estas ecuaciones son suficientes para determinar completamente K,y(x,1”), 
pues (iii) determina su valor para xp = xf» (ii) nos da su dependencia 
respecto a xo, y a partir de ello (i) nos da la dependencia respecto a 
x' . Puede verse fácilmente que la solución es 


Kay(x, 1) = ho3 j Y H1 4 (0pr + %m M)/potar e7+0722/% dp, (85) 


donde la Y se refiere a los valores = (p? + m2?)+ de po para valores particu- 
lares de pi, Pa, Pa. Verifica la condición (ii), pues al aplicarle el operador 
de (84) aparece en el integrando de (85) el factor (po — %;Pr — Am M), que 
multiplicado a la izquierda por el factor entre paréntesis () da cero. 
También verifica (tii), pues para xv = *'o, la suma respecto a po elimina 
el segundo término que figura dentro del paréntesis (). 

La ley de transformación de 4 y 4 dada en $ 68 hace que las cantidades 
pia )a a(x) se transformen como las cuatro componentes de un cuadri- 
vector, y que yYi(x)ami(x) sea invariante. Luego para cualquier cuadrivec- 
tor 14 y cualquier escalar $, 


legi(x)a,ab(x) + Sr) ama (x) (86) 


es invariante. La invariancia de (86) tiene que ser una condición sufi- 
ciente para asegurar la ley de transformación correcta para y y 4, pues nos 
permite deducir la invariancia de la ecuación de onda en y tomando 
lu = ih0/0x,, S = —m. 
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La invariancia de (86) implica la invariancia de 


(Ua, +8 Cm)ar kale olx) + dola)riala)>. 
Luego, 


(Va, + Sóm)arKoa(x, 1) (87) 


ha de ser invariante para Kay(x, x) dado por (85), y su invariancia sería 
una condición suficiente para asegurar la invariancia de las relaciones de 
anticonmutación. Para (87) resulta 


hs f S J(Ua, + Samjad(po + QrPr + AmM)wa €7072)P/Ap 71 dip 
il fz 3 £(lo — lado + Samlpo + 8rPr + mM) as 270720:9/2 py? dep 
= h-3 1 S 2lopo — lp, + Sm)e"2-02/2py1 dp. (88) 


Esta expresión es invariante frente a las transformaciones de Lorentz, de- 
bido a la invariancia de p;id3p. Por tanto, queda comprobada la inva- 
riancia relativista de la teoría. | 


79. La interacción 


El hamiltoniano completo para electrones y positrones en interacción 
con el campo electromagnética es 


H = Hp + Hp +Ho, (89) 


donde Hy es el hamiltoniano del campo electromagnético aislado, que vie- 
na dado por (19) o (45), Hp es el hamiltoniano de los electrones y positro- 
nes aislados, dado por (80) u (81), y Ha es la energía de interacción, que 
depende tanto de las variables dinámicas de los electrones y positrones 
como de las del campo electromagnético. "Tomamos 


Ho = j AM j, Px, (90) 


donde ¡, viene dado por (77) y (78) y, como veremos, con esta elección se 
obtienen las ecuaciones de movimiento correctas. Así pues, salvo términos 
numéricos infinitos, 


H = f (Fa (—ihab" — CA"4) + Pio ma — 36 A 05th — pt b)) dix — 
— (8x7) f (B,B" + A,"Aur) dex. (91) 
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Veamos cuáles son las ecuaciones de movimiento de Heisenberg que 
se obtienen con el hamiltoniano (91). Tenemos 


ih Ob ax /OXo = Pax H — Hbox 0 box(He + Ho) —(Hy EN Hobo 
== 1 [a x, box] Lay (— if," a en Y.) + 


+ lan ME o LA oda 
0 (al — ifap e eAr, bx) + Um max —CA beta: 


ih O m7 
al > + eA Jam o = 0. (92) 


que está de acuerdo con la ecuación de onda (11) del capítulo XI para 
un electrón. Como H es real, la ecuación de movimiento para «Y será la 
conjugada de la ecuación de movimiento para 4 y, por tanto, coincidirá 
con (12) del capítulo XI. Por consiguiente, la interacción (90) da correcta- 
mente la acción del campo sobre los electrones y positrones. Por otro lado, 
haciendo uso de los P.B. (46) 


DA, /0Xo = [A,, H] == As H y] 
=B, (93) 


Luego, 





CB x/OXo 7 [Bix H] 7 [B xo H y] “16 [B,.xo Ho] 
VA x + fl, Ai dex 

= WA ¿e + (94) 
De (93) y (94) resulta 


! 


DA, = 47), (95) 
que concuerda con la teoría de Maxwell y nos dice que la interacción (90) 
da correctamente la acción de los electrones y positrones sobre el campo. 
Para completar la teoría hemos de introducir las condiciones suple- 
mentarias (54). Hemos de comprobar que están de acuerdo con las ecua- 
ciones del movimiento. El método empleado en $ 77, que consistía en 
demostrar que las condiciones suplementarias en los distintos instantes en 
la imagen de Heisenberg eran coherentes, deja de ser aplicable ahora, 
pues las condiciones cuánticas que relacionan las variables dinámicas en los 
distintos instantes quedan modificadas por la interacción de forma dema- 
siado complicada para ser desarrolladas. Así pues, lo que haremos será 
obtener todas las condiciones suplementarias que afectan a las variables 
dinámicas en un instante y comprobar que son coherentes. 
Tenemos nuevamente las ecuaciones (56). Derivando de nuevo res- 


pecto a Xo resulta 
DJ9A,/0x, Z 0. (96) 
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Por otro lado, la ecuación de movimiento (92) para y, como en $ 68, nos 
lleva a 


Obpta,p)/0x, = 0, 
0j,/0x, = 0, (97) 


pues la diferencia entre — edi y jo aunque sea infinita es constante en el 
tiempo. De (95) resulta que (96) se verifica también como ecuación fuerte. 
Luego, las ecuaciones (56) son las únicas condiciones suplementarias inde- 
pendientes que afectan a las variables dinámicas en un instante de tiempo. 
De la primera resulta, como antes, (57), y de la segunda, con ayuda de (95) 
para p = 0, obtenemos ahora 


que es equivalente 2 


(Ag + BJ" + Ajo = 0. (98) 

Esta puede escribirse 
(Ap + U)" + 4rjo 0 (99) 

o también, según (39), 
div E — 4rjo = 0, (100) 


que es precisamente una de las ecuaciones de Maxwell. 
Puede verse, sin que hagamos los cálculos, que en un mismo instante, 
para dos puntos x y x' 


os jox»] — O, 


pues la diferencia entre — ep id y jo aunque sea infinita es constante en el 
no puede contener derivadas de 3(x — x”), y a la vez tiene que ser antisi- 
métrico en x y X”. Luego, los términos extra 4rjox de la ecuación (98) para 
los distintos valores de x, comparados con las correspondientes ecuacio- 
nes (58), conmutan entre sí y a su vez con todas las variables dinámicas 
que figuran en (58) y (57). Por consiguiente, dichos términos extra no 
alterarán la coherencia de (58) y (57), luego, (98) y (57) son coherentes. 

Nuestro método de introducir la interacción en la teoría no es relativista, 
pues la energía de interacción (90) llevaba consigo variables dinámicas en 
un instante en una referencia de Lorentz particular. Así pues, podemos 
preguntarnos si la teoría con interacción es relativista o no. Las ecuaciones 
de campo (92) y (95) así como las condiciones suplementarias (54), son evi- 
dentemente relativistas. Queda por saber si las condiciones cuánticas son 
invariantes bajo las transformaciones de Lorentz. 

Conocemos las condiciones cuánticas que relacionan todas nuestras va- 
riables dinámicas A,x, B.x» Yax» Pax en un instante dado xo. Como ya 
hemos dicho, no podemos desarrollar las condiciones cuánticas generales 
que relacionan las variables dinámicas en dos puntos cualesquiera del 
espacio-tiempo, porque la interacción las hace demasiado complicadas. Por 
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tanto, lo que haremos será llevar a cabo una transformación de Lorentz 
infinitesimal y desarrollar las condiciones cuánticas en el nuevo sistema 
de referencia. Si podemos demostrar que las condiciones cuánticas en un 
instante dado son invariantes frente a las transformaciones de Lorentz 
infinitesimales, quedará demostrado también su invariancia frente a las 
transformaciones de Lorentz finitas. 

Sea xs la coordenada temporal en el nuevo sistema de referencia. Estará 


relacionada con las coordenadas originales mediante la ecuación 
Xx = Xo + €0,Xr, (101) 


siendo e un número infinitesimal y v, un vector tridimensional tal que 
eo, sea la velocidad relativa entre las dos referencias. Despreciaremos los 
términos del orden de e? 

Una cantidad de campo y en el punto x y en el instante x* de la nueva 


referencia tendrá el valor 
x(x, a) == 52 o) + as — Xo) ON /OXo — ex, xo) + e0,)[xx, H]. (102) 
Su P.B. con otra cantidad de campo análoga Mx”, x*) será 


[x(x, 2%), AX”, x+)] = [x(x, xo) + €0, X,[%:, H], MX”, Xo0) + ¿O-X5[A xr, H] ] 
= [x(x, xo), MX”, x0)] + 20 ¿[Xx Lx, HA] + 
+ e0/Xr[ (Xx, H], Ax.) 
= [x(x, xo), MA”, %0)] + soda”, — %r)[%x, [Ax H]] + 
+ 50% [Xx Ax], H]. (103) 
Si x y A son variables Y o 4, nos interesará su anticonmutador y no su P.B. 
Utilizando la notación (69) del anticonmutador, tenemos 
[x(x, 24), Ax” x%)], 
= [x(x, o), AX”, X0)]+ + 20: [Xx [Ax Bd], + 0% [Xx HB], Ax)» 


= [u(x, xo), MA”, %0)]+ + e0r(%, — %7)[Xx, [Axrs HP]. +505%0[ [0 Asco] 17 
(104) 


Six y A son dos variables básicas cualesquiera A,,B,, Ya, Ya, el P.B. [Xxx Ax») 
o el anticonmutador [x,, Ax.]., según los casos, es un número y, en conse- 
cuencia, el último término de (103) o (104) es nulo. Llegamos pues a 
[x(x, 22), Mx", 189], = [n(x, 20), MX", %0)]., + 

+ 50d," — 25) [2x0 Dx Ho + Hr]L, + coa? —25)[%x0 [As He]. (105) 


donde [x, A], significa P.B. o anticonmutador, según los casos. A partir de 
la forma (90) de H¿ vemos que [Ax., Ho] sólo puede contener las variables 
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dinámicas Ax.» Yaxr, Pax, no pudiendo contener las derivadas de dichas 
variables. Por tanto, si [xx, [Ax., Hg]], no es nulo, habrá de ser un múl- 
tiplo de 3(x — x”), y no contendrá términos en las derivadas de 3(x — x”). 
Luego, el último término de (105) es nulo, Resulta, pues, que 


[x(x, 2H Aa, 14)], 
tiene el mismo valor que cuando no hay interacción, y, según lo visto en 
este caso, es invariante frente a las transformaciones de Lorentz. 

Es posible una crítica de la demostración anterior. Hemos desarrollado, 
en los distintos puntos, expresiones en potencias de e despreciando e?. 
Por ese procedimiento no podemos calcular [x(x), A(x)], para dos puntos 
cualesquiera del espacio-tiempo x y x” próximos entre sí, para los que 
x, —v, sea del orden de e, pues el resultado de dicho cálculo tiene que 
ser una función de (x, —x',) que tiene una singularidad cuando el cuadri- 
vector x — x' está sobre el cono de luz y, en consecuencia, tal función no 
puede desarrollarse en serie de potencias de las (x, —x”,). 

Para que el argumento sea válido hemos de volverlo a formular de 
modo que se evite el empleo de la función 3. En lugar de 

[x(x, x+), MX, a Mis 

hemos de calcular 


| f ayn(x, +) dix, f b¿ Mx, a) dex Í. (106) 


donde a, y b, son dos funciones continuas arbitrarias de x,, X2, Xg. Enton- 
ces las cantidades que tenemos que desarrollar en serie de potencias de e 
varían todas con continuidad, con un cambio continuo en la dirección del 
eje de tiempos, quedando así justificados los desarrollos. Las ecuaciones que 
obtenemos ahora son las de la demostración multiplicadas por axb,,déxd*x' 
e integradas. Llegamos a la misma conclusión de antes: los P.B. o los 
anticonmutadoras tienen los mismos valores que en ausencia de interacción. 

Podríamos ver que la razón de que la integración no modifique las con- 
diciones cuánticas es su simplicidad, es decir, el hecho de que sólo sea 
función de las variables dinámicas básicas y no de sus derivadas. Los P.B. 
y anticonmutadores tienen los mismos valores que en ausencia de interac- 
ción, siempre que se refieran a variables de dos puntos del espacio-tiempo 
consideradas en el mismo instante por algún observador. Esto significa 
que los dos puntos han de estar cada uno fuera del cono de luz del otro 
y únicamente se pueden aproximar a través de líneas que vayan por fuera 
del cono de luz. 


80. Variables físicas 


Todo ket |P> que represente un estado físico ha de verificar las condi- 
ciones suplementarias 


(Bo + AM]P>=0,  (divE —4rjo)[P> = 0. (107) 
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Una variable es física, si al aplicarla a cualquier ket que verifique dichas 
condiciones da como resultado otro ket que también las verifica. Ello exige 
que conmute con las cantidades 


B+ As, div€—4rio. (108) 


Veamos qué variables dinámicas sencillas gozan de esta propiedad. 

Las variables de campo transversales .%,, %, conmutan con las canti- 
tidades (108), y en consecuencia son variables físicas. La variable y, con- 
muta con la primera de las cantidades (108) pero no con la segunda, luego, 
no es una variable física. Tenemos 


ihlbax, box box ¡ES == (de box + Por bad bx 
= dar AX — Xbox —= Ya Ax — xx”). 
Luego, 
[bax, fox] = 18/R Pax MX —X'). (109) 
A partir de (42) 


[er Y x/%, divél,.] = 4rie/h . ex Rx —x). 


Por tanto, 
[eV x/Bg,,, div E, —4rjox,] =leYx/*, div Ex. libro: — Are Y x Mbs, fox.) 
= 0, 
Luego, si hacemos 
Ve == xP (110) 


y*. conmuta con las dos expresiones (108) y es una variable ra Análo- 
gamente también es variable física 4* . Las variables %,, B,, > Y* son 
las únicas variables físicas independientes, además de las propias canti- 
dades (108). 


Tenemos 
jo = — de(*tp* — yet), j. = —eb*tajr. (111) 


Luego, la densidad de carga y la corriente son variables físicas. También 
es fácil ver que € y MY son variables físicas, como sucedía cuando no 
existían electrones ni positrones. Todas las variables que no quedan modi- 
ficadas por la arbitrariedad que existe en la determinación de los poten- 
ciales electromagnéticos en la teoría de Maxwell, son variables físicas. 

El operador ¿,, representa la creación de un positrón o la aniquila- 
ción de un electrón en el lugar x. Veamos cuál es el significado físico del 
operador 4* . Segun (44), 


hler Vx/ñ, Er] = ect x/Bla, — 1.) [xx — x (78, 


y por tanto, 
ihlut., Sl — Eds LX — Y y) [ix — [78 
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o sea, 
Ent —= Y Er + ela — ar) ix — x]73). (112) 


Consideremos un estado |P> en el cual €, tenga ciertamente el valor c, 
en el punto x', o sea, 


Ea? == 07 
Entonces según (112) 
| Entr P> = 40, + ela, — 27)" — xd Po, 


luego, en el estado y*,|P>, €, en el punto x” tiene ciertamente el valor 
Cy + ela, — x,)[x" — x|7?. 


Esto significa que el operador yY%,, además de crear un positrón o aniqui- 
lar un electrón en el punto x, aumenta el campo eléctrico en el punto x' 
en la cantidad e(x/ — x,)ix” —x]|”*, que coincide precisamente con el cam- 
po de Coulomb clásico en el punto x” creado por un positrón de carga e 
en el punto x. Luego, el operador 4%, crea un positrón en el punto x 
junto con su campo coulombiano, o bien aniquila un electrón en el lu- 
gar x junto con su campo coulombiano. 

Para electrones y positrones en interacción con el campo electromag- 
nético, más que las variables y, y, son las variables y*, 5* las que corres- 
ponden al proceso físico de creación o aniquilación de electrones y posi- 
trones, pues dichos procesos siempre deben ir acompañados por el cambio 
correspondiente de Coulomb en el campo eléctrico alrededor del punto en 
que ha sido creada o aniquilada la partícula. Puede verse fácilmente que 
las variables y* ,3*_ verifican las mismas relaciones de anticonmutación 
(70) que las variables sin estrella. Al pasar a la representación de momentos, 
las cantidades importantes no serán las variables no físicas y, definidas 
por (67), sino las variables físicas y $ definidas por 


$% = ha Jaco dp, $e = ha i ep dx, (113) 


Ahora hemos de sustituir (68) por 


Al Ur Pr + Uy M | 


E | e 
Pp. 2 (p? + m?y | 


Ar Pr H+ Um M e 
PA 


y tomar ¿£ * Para representar la aniquilación de un electrón de momento p, 
5 para la creación de un electrón de momento p, ¿* para la creación de 
un positrón de momento — p y 7% para la aniquilación de un positrón de 
momento — p. Las variables ye E, 55 ¿ > Eh: 55, verificarán las mismas 
relaciones de anticonmutación que las correspondientes variables sin estrella. 


1 
Je, E =3|)!- 
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Podemos expresar el hamiltoniano enteramente en función de variables 
fisicas. Tenemos 


per — erV/ñ(qr + 1e/h .V"4). 
Luego, 


Hp + Ho = f GPtor[— if” — e(.%" —VIkb] + bom mas + Aljo) dex 
= | Pra (— to — est) q Prtammpt + Ajo) ds. 
El último término del integrando ha de combinarse ón Hp. De (49) y (57) 
Hp. = —(81)* j (U— A0XU + Ao)” dx 
Z Y f (U — Ao)jo dix 
con ayuda de (99). Luego, 
Hp + j A0jo dx = 4 f(U + Aojjo dix. 


Integrando (99) con ayuda de la fórmula (72) de $ 38 resulta 


AU | LE a, 
[x — x'| 


Hr + ] Ajo dix 5 ff a dixdix”. 
* 


y por tanto, 





Luego, se tiene 
H == H 
con 


H* — f [Pra (— ii —e ere) Y E mat) dix + 
+4H pr bj f f a dixd3x. (114) 


En la ecuación de Schródinger de un ket [P> que representa un estado 
físico, podemos emplear H* en lugar de H, pues para dicho ket se tiene 


H* sólo contiene variables físicas. Las variables de campo longitudinales 
no aparecen. En su lugar aparece el último término de (114), que es pre- 
cisamente la energía de interacción de Coulomb de todas las cargas pre- 
sentes. Es bastante extraño que aparezca un término de este tipo en una 
teoría relativista, pues representa la energía asociada con la propagación 
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instantánea de fuerzas. Dicho término aparece como resultado de habernos 
separado de la imagen de Heisenberg, que es donde se pone de manifiesto 
la invariancia de la teoría. 

Podríamos haber establecido una representación tomando como ket 
standard el producto del ket standard |0Í»> del campo electromagnético 
aislado, dado por (61) y (62), por el ket standard |0»> de los electrones y 
positrones aislados, dado por (74). Sin embargo, esta representación no 
sería adecuada, pues su ket standard no verificaría la segunda de las con- 
diciones suplementarias de (107). 

Otra representación más conveniente se obtiene tomando un ket stan- 
dard |0¿> que verifique 


(Bo + AO) =0, — (divE—4rjo)l0o> =0, (116) 
A ri l00> = 0, Son [09> = 0, Ep [09> = 0. (117) 


Estas condiciones son coherentes, pues los operadores que actúan sobre 
l0¿> en ellas conmutan o anticonmutan entre sí, y además son suficientes 
para fijar completamente [0y> salvo en un factor numérico, pues hay el 
mismo número de ecuaciones que las que se necesitan para fijar |0p>|0p>. 
Las condiciones (116) muestran que |0y> verifica las condiciones suple- 
mentarias y, por tanto, representa un estado físico. Las condiciones (117) 
nos dicen que |0y4> representa un estado en el que no existen fotones, 
electrones ni positrones. 

Cualquier ket |P> que verifique las condiciones suplementarias (107) y 
que, en consecuencia, represente un estado físico puede expresarse en 
forma de una variable física aplicada al ket [0¿>. Las únicas variables físi- 
cas independientes que no dan resultados nulos al ser aplicadas a |0Q> 
son Ar, E pe Eno . Luego, 


P> = Vin, EX, E, )/00>. (118) 


Así pues, |P> está representado por un funcional de onda “Y de las varia- 
bles Fox, E cs Sl Es una serie de potencias en dichas variables, cuyos 
distintos términos corresponden a la existencia de los distintos números de 
fotones, electrones y positrones con sus campos coulombianos. 

Empleando la representación (118) y el hamiltoniano H*, podemos no 
tener en cuenta las condiciones (116), ya que no jugarán ningún papel en la 
resolución de la ecuación de Schródinger (115). Las variables longitudi- 
nales ya no vuelven a aparecer en la teoría. 
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81. Dificultades de la teoría 


El ket standard [0¿> representa un estado en el que no existen fotones, 
electrones ni positrones. Podríamos inclinarnos a pensar que dicho estado 
representa el vacío perfecto, pero no puede ser así pues no es estacionario. 
Para que fuese estacionario necesitaríamos que 


H*l09> = Ci00> 


siendo C un número. Pero H* contiene los términos 


e $ guta, St dix f/f at dixd3x”, (119) 


que al aplicarlos al ket ¡04 no dan factores numéricos, y en consecuen- 
cia, destruyen el carácter estaciunario de [0p>. 

Dichos términos pueden ser considerados como una perturbación que 
da lugar a una probabilidad de que el estado |0y> pase a otro estado, de 
acuerdo con la teoría de $ 44. El primero de dichos términos descompuesto 
en componentes de Fourier contiene una parte 


— elsa j | AEREA hdp, (120) 


que da lugar a transiciones en las que se emite un fotón y en las que simul- 
táneamente se crea un par electrón-positrón. Tras un corto intervalo de 
tiempo, la probabilidad de transición es proporcional al cuadrado de la 
longitud del ket que se obtiene aplicando (120) al ket inicial 10¿>, y vale 


el ra(% so X 
SN WR MRE y IOCIAPOLO 
= Anar(%)ea | | ] 1 OAK A] 
AE E ME ra 109 10099 Bd pdrK dep”. 


Empleando los valores de los P.B. y anticonmutadores dados por (4), (16), 
(72), (73) se obtiene un integrando que depende de las variables k, k” según 
la ley |k|"13(k — k') para valores grandes de k y k”. Con ello resulta una 
integral divergente, y así la probabilidad de transición es infinita. 

El segundo término de (119), descompuesto en componentes de Fourier, 
contiene términos como ¿$ ££, 22,5%, .,.y» que dan lugar a transiciones 
en las que se crean simultáneamente dos pares electrón-positrón. Podemos 
calcular igualmente esta probabilidad de transición, obteniéndose también 
un valor infinito. 


Según estos cálculos resulta que el estado Oy no es estacionario ni 
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siquiera aproximadamente. Una dificultad más seria es el hecho de que no 
se pueda utilizar el método de perturbaciones para tratar la ecuación de 
ondas cuando conduce a probabilidades de transición del estado inicial 
que se considere. En cambio, no se conoce ningún otro método capaz de 
sustituirlo y, por tanto, no se conoce ninguna solución de la ecuación 
de onda de la electrodinámica cuántica. 

El origen de este conflicto reside en las fluctuaciones de la densidad 
del mar de electrones de energía negativa, fluctuaciones que se presentan 
siempre en la teoría de electrones y positrones en ausencia de campo elec- 
tromagnético. La densidad de electrones en estados tanto de energía 
positiva como de energía negativa es 


MT 1 E 
Por tanto, según (74) 
| ».J0p> = EtEa 109) + (LLL + (65. Za)]00>- (121) 
Las relaciones de anticonmutación (73) para las Y y las Z nos dicen que 
E EZ (199) 


es un número, aunque sea infinito, y por tanto el segundo término del se- 
gundo miembro de (121) es un múltiplo numérico de |0p>. En cambio, el 
primero no puede ser nunca un múltiplo numérico de [Op», y en consecuen- 
cia, l0p> no es un autoket de px. Esto implica que la densidad del mar de 
electrones de energía negativa en el vacío no es constante, sino que está 
sometida a fluctuaciones continuas. 

Siguiendo la idea de $ 73, a fin de obtener una cantidad físicamente 
importante — la densidad de electrones de energía positiva menos la den- 
sidad de positrones — restaremos de la densidad de todos los electrones 
la densidad de la distribución de vacío. La cantidad que así se obtiene es 
la densidad de carga que debe emplearse en la ecuación de Maxwell (58) 
de $ 73. En una teoría exacta de la electrodinámica cuántica, la cantidad 
que restamos ha de ser un operador bien definido, que ha de poder ser 
introducido en las ecuaciones. Lo mejor que podemos hacer es tomar para 
dicho operador la parte constante (122) de la densidad de la distribución 
de vacío dejando de restar la parte que da lugar a fluctuaciones. Con ello 


resulta 
dox = —elidrx — (Eilx + Elbx)- (123) 
Con ayuda de la relación 
Ett, + EE = Tilx + Ebo 
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que se obtiene a partir de las relaciones de anticonmutación (72) y (73) 
haciendo a = b y sumando, resulta inmediatamente que (123) coincide con 
la expresión (77) que teníamos para jo. 

- Pero como no hemos restado la parte de la densidad de la distribución 
de vacío que da lugar a fluctuaciones, ésta continúa formando parte de 
la densidad de carga que se aplica al ket de vacío, es decir, 


joxl0p> = —e8l g.J0p>. 


Luego, la densidad de carga del vacío no es cero. Llegamos al resultado 
aparentemente paradójico de que, pese a que el estado vacío ha sido 
definido como un estado en el que no existe ningún electrón ni ningún posi- 
trón, sigue teniendo densidad de carga no nula, Este resultado es una con- 
secuencia necesaria de no haber podido restar las fluctuaciones del mar de 
electrones de energía negativa, incluso en el caso en que no hay interacción 
con el campo electromagnético. 

Existe también alguna dificultad en relación con el término constan- 
te (122) de la densidad de distribución de vacio. Por una consideración de 
simetría, es de esperar que no aparezca ningún término constante en la 
corriente producida por el movimiento de los electrones de la distribución 
de vacío, con lo que tendremos una densidad de carga a la que no está 
asociada ninguna corriente. Esto determina un sistema de referencia de 
Lorentz privilegiado, cosa que en una teoría relativista no debería ocurrir. 

El punto de apoyo para salvar esta incoherencia reside en que la co- 
rriente producida por el movimiento de los electrones de la distribución 
de vacio, en realidad, es una diferencia entre dos infinitos, y por consi- 
guiente, no es una cantidad bien definida. Dicho término constante puede 
ser obtenido por un paso al límite, llevado a cabo en un sistema de refe- 
rencia de Lorentz particular, obteniendo así un valor particular; pero dicho 
valor no debería ser más privilegiado que otros. La ambigiiedad en el tér- 
mino constante de la corriente no representa una dificultad seria para la 
teoría, ya que podemos evitar dicha ambigiiedad definiendo de nuevo 
jr por 

jrx = ep amb, — Y al yx.) 


en lugar de por (78). Con ello queda en la misma forma que la expre- 
sión (77) de jo, y nos permite escribir la ecuación relativista 


1. =—35e($ ay — pai y). (124) 


La dificultad de las fluctuaciones es mucho más seria. Al poner en 
interacción la densidad de carga fluctuante del vacío con el campo electro- 
magnético ésta da lugar a la aparición de un campo eléctrico fluctuante, 
según se deduce de la ecuación de Maxwell (100), que actúa sobre el mar 
de electrones de energía negativa dando lugar a la creación de pares 





y 
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electrón-positrón. Si intentamos calcular esta acción nos encontramos con 
integrales divergentes, lo que impide obtener una solución de la ecuación 
de onda con interacción. en 

Ya habían aparecido antes en la teoría algunas cantidades infinitas, 
pero ninguna de ellas constituía una dificultad seria, pues no jugaban 
ningún papel importante en las ecuaciones; podíamos evitarlas volviendo a 
definir las cantidades de forma conveniente. Así teníamos el infinito del 
punto cero de la energía del campo electromagnético transversal Hpr 
dada por (47), que pudimos evitar empleando (65). Nos encontrábamos 
también con el infinito del punto cero de la energía de los electrones y 
positrones Hp, dada por (80), y con el término infinito que aparecía explí- 
citamente en la forma (82) de Hp. Dicho infinito nos fue posible evitarlo 
considerando Hp en la forma (81). Apareció también la parte constante 
infinita de la densidad de electrones del vacío (122), que pudimos eliminar 
de la teoría empleando la fórmula (124) para j,. En cambio, no existe 
ninguna posibilidad de volver a formular la teoría que nos permita evitar 
los infinitos de las fluctuaciones. 

Se ha conseguido establecer ciertas reglas que permiten eliminar de un 
modo coherente los infinitos que se derivan de las fluctuaciones, habiéndose 
obtenido con ello una teoría capaz de ser desarrollada, y a partir de la 
cual se pueden obtener resultados que pueden ser confrontados con los 
experimentos. En la confrontación se ha encontrado buena concordancia, 
lo que indica que las reglas tienen cierta validez. Pero dichas reglas sólo se 
pueden aplicar a problemas particulares, que por lo general son problemas 
de colisión, y no encajan en los fundamentos lógicos de la mecánica 
cuántica. Por tanto, no pueden ser consideradas como una solución satis- 
factoria de las dificultades. 

Parece ser que hemos seguido hasta donde es posible el desarrollo 
lógico de las ideas de la mecánica cuántica tal y cómo se conocen hoy en 
día. Teniendo en cuenta que las dificultades son de carácter muy profun- 
do, únicamente pueden ser superadas por un cambio drástico de los fun- 


. damentos de la teoría, probablemente tan drástico como el paso de la 


teoría de las órbitas de Bohr a la mecánica cuántica actual. 
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